Data Analytics

Python & Pandas - Fondamentaux

DataFrames, Series, indexation (loc, iloc), filtrage booléen, types de données, read_csv, describe, info, head/tail, shape, columns

20 questions d'entretien·
Junior
1

Quelle est la structure de données principale de Pandas pour stocker des données tabulaires ?

Réponse

Le DataFrame est la structure de données centrale de Pandas. Il représente un tableau bidimensionnel avec des lignes et des colonnes, similaire à une feuille de calcul ou une table SQL. Chaque colonne est une Series, et chaque ligne possède un index. Le DataFrame permet de manipuler efficacement des données structurées grâce à ses nombreuses méthodes intégrées.

2

Qu'est-ce qu'une Series dans Pandas ?

Réponse

Une Series est un tableau unidimensionnel avec un index. Elle représente une seule colonne de données dans un DataFrame. Chaque élément possède un label (index) qui permet un accès rapide par nom ou position. Une Series ne peut contenir qu'un seul type de données (int, float, string, etc.), ce qui la distingue d'une simple liste Python.

3

Quelle fonction Pandas permet de lire un fichier CSV et de le charger dans un DataFrame ?

Réponse

La fonction pd.read_csv() lit un fichier CSV et retourne un DataFrame. Elle accepte de nombreux paramètres : sep pour le délimiteur, header pour la ligne d'en-tête, encoding pour l'encodage du fichier, dtype pour forcer les types de colonnes, et na_values pour définir les valeurs manquantes. C'est la méthode la plus courante pour importer des données dans Pandas.

4

Que retourne la méthode df.shape sur un DataFrame ?

5

Quelle méthode permet d'afficher les 5 premières lignes d'un DataFrame ?

+17 questions d'entretien

Maîtrise Data Analytics pour ton prochain entretien

Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.

Commencer gratuitement