
Python Analytics - Analisi avanzata e ML
groupby, merge, pivot_table, apply/map, Plotly, Scikit-Learn (regressione, classificazione, clustering), train/test split, metriche, Jupyter, Google Colab
1Qual è la principale differenza tra i metodi apply() e map() su una Series di Pandas?
Qual è la principale differenza tra i metodi apply() e map() su una Series di Pandas?
Risposta
Il metodo map() è progettato per mappare ogni valore in una Series a un nuovo valore tramite un dizionario o una funzione, e funziona solo su Series. Al contrario, apply() è più flessibile: può applicare una funzione elemento per elemento su una Series o riga per riga / colonna per colonna su un DataFrame. Per trasformazioni semplici valore per valore su una Series, map() è generalmente più veloce e più leggibile.
2Quale metodo Pandas si dovrebbe usare per aggregare dati con più funzioni di aggregazione su colonne diverse simultaneamente?
Quale metodo Pandas si dovrebbe usare per aggregare dati con più funzioni di aggregazione su colonne diverse simultaneamente?
Risposta
Il metodo agg() (o aggregate()) permette di applicare diverse funzioni di aggregazione a diverse colonne in una singola operazione. Accetta un dizionario dove le chiavi sono i nomi delle colonne e i valori sono le funzioni da applicare. Questo approccio è più efficiente e leggibile rispetto al concatenare più chiamate groupby con funzioni individuali.
3Qual è la differenza tra merge() e join() in Pandas?
Qual è la differenza tra merge() e join() in Pandas?
Risposta
merge() è una funzione più flessibile che unisce due DataFrame su colonne specifiche utilizzando i parametri on, left_on/right_on, o gli indici. join() è un metodo di DataFrame che unisce sugli indici per default ed è più conciso per join semplici basati su indici. Per join complessi su colonne non-indice, merge() è preferibile poiché offre più controllo sulle colonne di join.
Come creare una pivot table con pivot_table() specificando più funzioni di aggregazione?
Qual è lo scopo di transform() in un contesto groupby() rispetto ad apply()?
+17 domande da colloquio
Altri argomenti di colloquio Data Analytics
Google Sheets - Fondamenti
Google Sheets - Formule avanzate
SQL - Fondamenti
SQL - Aggregazioni e raggruppamenti
SQL - Join
BigQuery - Fondamenti
Data Cleaning - Pulizia dei dati
KPI e metriche di business
Statistica descrittiva
Zapier e automazione No-Code
Principi di data visualization
Python & Pandas - Fondamenti
Google Sheets - Dashboard automatizzate
SQL - Subquery e CTE
SQL - Window Functions
BigQuery - Funzionalità avanzate
Data Modeling
Analisi di funnel e conversione
Analisi delle coorti e retention
Google Tag Manager e tracking
API e webhook
dbt - Fondamenti
AB Testing e statistica applicata
Looker Studio (Google Data Studio)
Power BI - Fondamenti
SQL - Query analitiche avanzate
dbt - Funzionalità avanzate
Power BI - DAX e dashboard avanzate
Padroneggia Data Analytics per il tuo prossimo colloquio
Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.
Inizia gratis