Data Science & ML

Fondamenti di Pandas

DataFrames, Series, indicizzazione, selezione, filtraggio, valori mancanti, tipi di dati

22 domande da colloquio·
Junior
1

Qual è la struttura dati principale di Pandas per memorizzare dati tabulari con righe e colonne nominate?

Risposta

Il DataFrame è la struttura dati centrale di Pandas, progettata per memorizzare dati tabulari bidimensionali. Ogni colonna può contenere un tipo di dati diverso e sia righe che colonne hanno etichette (index). Questa struttura è simile a un foglio di calcolo Excel o una tabella SQL, facilitando la manipolazione di dati strutturati.

2

Quale struttura Pandas rappresenta una singola colonna di dati con un indice?

Risposta

Una Series è una struttura unidimensionale che può contenere qualsiasi tipo di dati (interi, stringhe, float, oggetti Python). Ogni elemento ha un indice associato, consentendo l'accesso ai valori tramite la loro etichetta. Una colonna estratta da un DataFrame viene automaticamente convertita in Series.

3

Come creare un DataFrame da un dizionario Python dove le chiavi diventano nomi di colonne?

Risposta

La funzione pd.DataFrame() accetta direttamente un dizionario Python. Le chiavi del dizionario diventano automaticamente nomi di colonne e i valori (liste o array) diventano i dati di ogni colonna. Questo metodo è il più comune per creare DataFrame da dati strutturati in Python.

4

Quale metodo dovrebbe essere usato per leggere un file CSV e caricarlo in un DataFrame?

5

Quale metodo mostra le prime righe di un DataFrame per un'anteprima rapida dei dati?

+19 domande da colloquio

Padroneggia Data Science & ML per il tuo prossimo colloquio

Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.

Inizia gratis