
Python Analytics - Zaawansowana analiza i ML
groupby, merge, pivot_table, apply/map, Plotly, Scikit-Learn (regresja, klasyfikacja, clustering), train/test split, metryki, Jupyter, Google Colab
1Jaka jest główna różnica między metodami apply() i map() na Pandas Series?
Jaka jest główna różnica między metodami apply() i map() na Pandas Series?
Odpowiedź
Metoda map() jest zaprojektowana do mapowania każdej wartości w Series na nową wartość za pomocą słownika lub funkcji i działa tylko na Series. W przeciwieństwie do tego apply() jest bardziej elastyczna: może zastosować funkcję element po elemencie na Series lub wiersz po wierszu / kolumna po kolumnie na DataFrame. Dla prostych transformacji wartość-na-wartość na Series, map() jest zazwyczaj szybsza i bardziej czytelna.
2Której metody Pandas użyć do agregowania danych z wieloma funkcjami agregacji na różnych kolumnach jednocześnie?
Której metody Pandas użyć do agregowania danych z wieloma funkcjami agregacji na różnych kolumnach jednocześnie?
Odpowiedź
Metoda agg() (lub aggregate()) pozwala na zastosowanie różnych funkcji agregacji do różnych kolumn w jednej operacji. Akceptuje słownik, w którym klucze to nazwy kolumn, a wartości to funkcje do zastosowania. To podejście jest bardziej wydajne i czytelne niż łączenie wielu wywołań groupby z indywidualnymi funkcjami.
3Jaka jest różnica między merge() a join() w Pandas?
Jaka jest różnica między merge() a join() w Pandas?
Odpowiedź
merge() to bardziej elastyczna funkcja, która łączy dwa DataFrame na określonych kolumnach przy użyciu parametrów on, left_on/right_on lub indeksów. join() to metoda DataFrame, która domyślnie łączy po indeksach i jest bardziej zwięzła dla prostych łączeń opartych na indeksach. Dla złożonych łączeń na kolumnach nieindeksowych preferowana jest merge(), ponieważ oferuje większą kontrolę nad kolumnami łączenia.
Jak utworzyć tabelę przestawną za pomocą pivot_table() z określeniem wielu funkcji agregacji?
Jaki jest cel transform() w kontekście groupby() w porównaniu z apply()?
+17 pytań z rozmów
Inne tematy rekrutacyjne Data Analytics
Google Sheets - Podstawy
Google Sheets - Zaawansowane formuły
SQL - Podstawy
SQL - Agregacje i grupowanie
SQL - Złączenia
BigQuery - Podstawy
Data Cleaning - Czyszczenie danych
KPI i metryki biznesowe
Statystyka opisowa
Zapier i automatyzacja No-Code
Zasady wizualizacji danych
Python & Pandas - Podstawy
Google Sheets - Automatyczne dashboardy
SQL - Podzapytania i CTE
SQL - Window Functions
BigQuery - Funkcje zaawansowane
Data Modeling
Analiza funneli i konwersji
Analiza kohort i retencji
Google Tag Manager i tracking
API i webhooki
dbt - Podstawy
AB Testing i statystyka stosowana
Looker Studio (Google Data Studio)
Power BI - Podstawy
SQL - Zaawansowane zapytania analityczne
dbt - Funkcje zaawansowane
Power BI - DAX i zaawansowane dashboardy
Opanuj Data Analytics na następną rozmowę
Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.
Zacznij za darmo