Data Analytics

Python & Pandas - Fondamenti

DataFrame, Series, indicizzazione (loc, iloc), filtraggio booleano, tipi di dati, read_csv, describe, info, head/tail, shape, columns

20 domande da colloquio·
Junior
1

Qual è la struttura dati principale di Pandas per memorizzare dati tabulari?

Risposta

Il DataFrame è la struttura dati centrale di Pandas. Rappresenta una tabella bidimensionale con righe e colonne, simile a un foglio di calcolo o a una tabella SQL. Ogni colonna è una Series, e ogni riga ha un indice. Il DataFrame consente di manipolare efficacemente dati strutturati grazie ai suoi numerosi metodi integrati.

2

Cos'è una Series in Pandas?

Risposta

Una Series è un array unidimensionale con un indice. Rappresenta una singola colonna di dati in un DataFrame. Ogni elemento ha un'etichetta (indice) che consente un accesso rapido per nome o posizione. Una Series può contenere un solo tipo di dato (int, float, string, ecc.), il che la distingue da una semplice lista Python.

3

Quale funzione di Pandas legge un file CSV e lo carica in un DataFrame?

Risposta

La funzione pd.read_csv() legge un file CSV e restituisce un DataFrame. Accetta molti parametri: sep per il delimitatore, header per la riga di intestazione, encoding per la codifica del file, dtype per forzare i tipi di colonne, e na_values per definire i valori mancanti. È il metodo più comune per importare dati in Pandas.

4

Cosa restituisce l'attributo df.shape su un DataFrame?

5

Quale metodo visualizza le prime 5 righe di un DataFrame?

+17 domande da colloquio

Padroneggia Data Analytics per il tuo prossimo colloquio

Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.

Inizia gratis