Data Science & ML

Les bases de Pandas

DataFrames, Series, indexation, sélection, filtrage, valeurs manquantes, types de données

22 questions d'entretien·
Junior
1

Quelle est la structure de données principale de Pandas pour stocker des données tabulaires avec des lignes et des colonnes nommées ?

Réponse

Le DataFrame est la structure de données centrale de Pandas, conçue pour stocker des données tabulaires bidimensionnelles. Chaque colonne peut contenir un type de données différent, et les lignes comme les colonnes possèdent des étiquettes (index). Cette structure est similaire à une feuille de calcul Excel ou une table SQL, ce qui facilite la manipulation de données structurées.

2

Quelle structure Pandas représente une seule colonne de données avec un index ?

Réponse

Une Series est une structure unidimensionnelle qui peut contenir n'importe quel type de données (entiers, chaînes, flottants, objets Python). Chaque élément possède un index associé, ce qui permet d'accéder aux valeurs par leur étiquette. Une colonne extraite d'un DataFrame est automatiquement convertie en Series.

3

Comment créer un DataFrame à partir d'un dictionnaire Python où les clés deviennent les noms de colonnes ?

Réponse

La fonction pd.DataFrame() accepte directement un dictionnaire Python. Les clés du dictionnaire deviennent automatiquement les noms des colonnes, et les valeurs (listes ou arrays) deviennent les données de chaque colonne. Cette méthode est la plus courante pour créer des DataFrames à partir de données structurées en Python.

4

Quelle méthode utiliser pour lire un fichier CSV et le charger dans un DataFrame ?

5

Quelle méthode affiche les premières lignes d'un DataFrame pour un aperçu rapide des données ?

+19 questions d'entretien

Maîtrise Data Science & ML pour ton prochain entretien

Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.

Commencer gratuitement