
Python Analytics - Erweiterte Analyse und ML
groupby, merge, pivot_table, apply/map, Plotly, Scikit-Learn (Regression, Klassifikation, Clustering), train/test split, Metriken, Jupyter, Google Colab
1Was ist der Hauptunterschied zwischen den Methoden apply() und map() bei einer Pandas Series?
Was ist der Hauptunterschied zwischen den Methoden apply() und map() bei einer Pandas Series?
Antwort
Die Methode map() ist dafür gedacht, jeden Wert einer Series über ein Dictionary oder eine Funktion auf einen neuen Wert abzubilden, und funktioniert nur bei Series. Im Gegensatz dazu ist apply() flexibler: Sie kann eine Funktion elementweise auf eine Series oder zeilen-/spaltenweise auf ein DataFrame anwenden. Für einfache Wert-zu-Wert-Transformationen auf einer Series ist map() in der Regel schneller und lesbarer.
2Welche Pandas-Methode sollte verwendet werden, um Daten mit mehreren Aggregationsfunktionen auf verschiedenen Spalten gleichzeitig zu aggregieren?
Welche Pandas-Methode sollte verwendet werden, um Daten mit mehreren Aggregationsfunktionen auf verschiedenen Spalten gleichzeitig zu aggregieren?
Antwort
Die Methode agg() (oder aggregate()) ermöglicht es, verschiedene Aggregationsfunktionen auf verschiedene Spalten in einer einzigen Operation anzuwenden. Sie akzeptiert ein Dictionary, in dem die Schlüssel Spaltennamen und die Werte die anzuwendenden Funktionen sind. Dieser Ansatz ist effizienter und lesbarer als das Verketten mehrerer groupby-Aufrufe mit einzelnen Funktionen.
3Was ist der Unterschied zwischen merge() und join() in Pandas?
Was ist der Unterschied zwischen merge() und join() in Pandas?
Antwort
merge() ist eine flexiblere Funktion, die zwei DataFrames anhand bestimmter Spalten mit den Parametern on, left_on/right_on oder Indizes verbindet. join() ist eine DataFrame-Methode, die standardmäßig über Indizes verbindet und für einfache indexbasierte Joins prägnanter ist. Für komplexe Joins über Nicht-Index-Spalten ist merge() vorzuziehen, da es mehr Kontrolle über die Join-Spalten bietet.
Wie erstellt man eine Pivot-Tabelle mit pivot_table() unter Angabe mehrerer Aggregationsfunktionen?
Was ist der Zweck von transform() in einem groupby()-Kontext im Vergleich zu apply()?
+17 Interview-Fragen
Weitere Data Analytics-Interviewthemen
Google Sheets - Grundlagen
Google Sheets - Erweiterte Formeln
SQL - Grundlagen
SQL - Aggregationen und Gruppierungen
SQL - Joins
BigQuery - Grundlagen
Data Cleaning - Datenbereinigung
KPIs und Business-Metriken
Deskriptive Statistik
Zapier und No-Code-Automatisierung
Grundlagen der Datenvisualisierung
Python & Pandas - Grundlagen
Google Sheets - Automatisierte Dashboards
SQL - Unterabfragen und CTEs
SQL - Window Functions
BigQuery - Erweiterte Funktionen
Data Modeling
Funnel- und Conversion-Analyse
Kohorten- und Retention-Analyse
Google Tag Manager und Tracking
APIs und Webhooks
dbt - Grundlagen
AB-Testing und angewandte Statistik
Looker Studio (Google Data Studio)
Power BI - Grundlagen
SQL - Erweiterte analytische Abfragen
dbt - Erweiterte Funktionen
Power BI - DAX und fortgeschrittene Dashboards
Meistere Data Analytics für dein nächstes Interview
Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.
Kostenlos starten