Data Science & ML

Pandas avanzato

GroupBy, merge, concat, pivot tables, time series, apply/transform, MultiIndex, prestazioni

24 domande da colloquio·
Mid-Level
1

Quale metodo permette di applicare più funzioni di aggregazione diverse a una singola colonna con groupby?

Risposta

Il metodo agg() (o aggregate()) permette di applicare più funzioni di aggregazione alle stesse colonne. È possibile passare una lista di funzioni come ['sum', 'mean', 'count'] o un dizionario per specificare funzioni diverse per colonna. Questa flessibilità è essenziale per creare report statistici completi in una singola operazione.

2

Come nominare esplicitamente le colonne risultanti durante un'aggregazione con groupby usando la sintassi named aggregation?

Risposta

La sintassi named aggregation usa agg() con tuple nominate tramite keyword argument. Esempio: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')). Questo approccio produce nomi di colonne espliciti e leggibili, evitando MultiIndex nelle colonne che possono complicare elaborazioni successive.

3

Qual è la differenza principale tra transform() e apply() in un contesto groupby?

Risposta

transform() restituisce un risultato della stessa dimensione dell'input, allineato all'indice originale, ideale per aggiungere statistiche di gruppo a ogni riga (es. media del gruppo). apply() è più flessibile e può restituire un risultato di dimensione diversa, ma generalmente è più lento. Usa transform() per operazioni come la normalizzazione di gruppo o il calcolo di z-score.

4

Come filtrare i gruppi in un groupby per mantenere solo quelli che soddisfano una condizione (per esempio, gruppi con più di 10 elementi)?

5

Qual è la differenza tra pd.merge() con how='left' e how='inner'?

+21 domande da colloquio

Padroneggia Data Science & ML per il tuo prossimo colloquio

Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.

Inizia gratis