Data Science & ML

Zaawansowany Pandas

GroupBy, merge, concat, pivot tables, time series, apply/transform, MultiIndex, wydajność

24 pytań z rozmów·
Mid-Level
1

Która metoda pozwala zastosować wiele różnych funkcji agregacji do jednej kolumny z groupby?

Odpowiedź

Metoda agg() (lub aggregate()) pozwala stosować wiele funkcji agregacji do tych samych kolumn. Można przekazać listę funkcji jak ['sum', 'mean', 'count'] lub słownik, aby określić różne funkcje dla każdej kolumny. Ta elastyczność jest niezbędna do tworzenia kompleksowych raportów statystycznych w jednej operacji.

2

Jak jawnie nazwać kolumny wynikowe podczas agregacji groupby używając składni named aggregation?

Odpowiedź

Składnia named aggregation używa agg() z nazwanymi krotkami przez argumenty kluczowe. Przykład: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')). To podejście produkuje jawne i czytelne nazwy kolumn, unikając MultiIndex w kolumnach, które mogą komplikować dalsze przetwarzanie.

3

Jaka jest główna różnica między transform() a apply() w kontekście groupby?

Odpowiedź

transform() zwraca wynik o tym samym rozmiarze co wejście, wyrównany do oryginalnego indeksu, idealny do dodawania statystyk grupy do każdego wiersza (np. średnia grupy). apply() jest bardziej elastyczny i może zwrócić wynik o innym rozmiarze, ale jest generalnie wolniejszy. Używaj transform() do operacji jak normalizacja grupowa czy obliczanie z-score.

4

Jak filtrować grupy w groupby, aby zachować tylko te spełniające warunek (np. grupy z więcej niż 10 elementami)?

5

Jaka jest różnica między pd.merge() z how='left' a how='inner'?

+21 pytań z rozmów

Opanuj Data Science & ML na następną rozmowę

Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.

Zacznij za darmo