Data Science & ML

Fortgeschrittenes Pandas

GroupBy, merge, concat, pivot tables, time series, apply/transform, MultiIndex, Performance

24 Interview-Fragen·
Mid-Level
1

Welche Methode ermöglicht es, mehrere verschiedene Aggregationsfunktionen auf eine einzelne Spalte mit groupby anzuwenden?

Antwort

Die agg()- (oder aggregate())-Methode ermöglicht es, mehrere Aggregationsfunktionen auf dieselben Spalten anzuwenden. Sie können eine Liste von Funktionen wie ['sum', 'mean', 'count'] oder ein Dictionary übergeben, um verschiedene Funktionen pro Spalte anzugeben. Diese Flexibilität ist wesentlich für die Erstellung umfassender statistischer Berichte in einem einzigen Vorgang.

2

Wie kann man die resultierenden Spalten während einer groupby-Aggregation mit der named aggregation-Syntax explizit benennen?

Antwort

Die named aggregation-Syntax verwendet agg() mit benannten Tupeln über Keyword-Argumente. Beispiel: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')). Dieser Ansatz erzeugt explizite und lesbare Spaltennamen und vermeidet MultiIndex in Spalten, die nachfolgende Verarbeitung erschweren können.

3

Was ist der Hauptunterschied zwischen transform() und apply() in einem groupby-Kontext?

Antwort

transform() gibt ein Ergebnis der gleichen Größe wie die Eingabe zurück, ausgerichtet am ursprünglichen Index, ideal um Gruppenstatistiken zu jeder Zeile hinzuzufügen (z.B. Gruppenmittelwert). apply() ist flexibler und kann ein Ergebnis unterschiedlicher Größe zurückgeben, ist aber im Allgemeinen langsamer. Verwenden Sie transform() für Operationen wie Gruppennormalisierung oder z-Score-Berechnung.

4

Wie filtert man Gruppen in einem groupby, um nur diejenigen zu behalten, die eine Bedingung erfüllen (z.B. Gruppen mit mehr als 10 Elementen)?

5

Was ist der Unterschied zwischen pd.merge() mit how='left' und how='inner'?

+21 Interview-Fragen

Meistere Data Science & ML für dein nächstes Interview

Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.

Kostenlos starten