Question 1

Quelle est la structure de données principale de Pandas pour stocker des données tabulaires ?

Accepted Answer

Le DataFrame est la structure de données centrale de Pandas. Il représente un tableau bidimensionnel avec des lignes et des colonnes, similaire à une feuille de calcul ou une table SQL. Chaque colonne est une Series, et chaque ligne possède un index. Le DataFrame permet de manipuler efficacement des données structurées grâce à ses nombreuses méthodes intégrées.

Question 2

Qu'est-ce qu'une Series dans Pandas ?

Accepted Answer

Une Series est un tableau unidimensionnel avec un index. Elle représente une seule colonne de données dans un DataFrame. Chaque élément possède un label (index) qui permet un accès rapide par nom ou position. Une Series ne peut contenir qu'un seul type de données (int, float, string, etc.), ce qui la distingue d'une simple liste Python.

Question 3

Quelle fonction Pandas permet de lire un fichier CSV et de le charger dans un DataFrame ?

Accepted Answer

La fonction pd.read_csv() lit un fichier CSV et retourne un DataFrame. Elle accepte de nombreux paramètres : sep pour le délimiteur, header pour la ligne d'en-tête, encoding pour l'encodage du fichier, dtype pour forcer les types de colonnes, et na_values pour définir les valeurs manquantes. C'est la méthode la plus courante pour importer des données dans Pandas.

Python & Pandas - Fondamentaux

Quelle est la structure de données principale de Pandas pour stocker des données tabulaires ?

Réponse

Qu'est-ce qu'une Series dans Pandas ?

Réponse

Quelle fonction Pandas permet de lire un fichier CSV et de le charger dans un DataFrame ?

Réponse

Que retourne la méthode df.shape sur un DataFrame ?

Quelle méthode permet d'afficher les 5 premières lignes d'un DataFrame ?

Autres sujets d'entretien Data Analytics

Google Sheets - Les fondamentaux

Google Sheets - Formules avancées

SQL - Les fondamentaux

SQL - Agrégations et groupements

SQL - Jointures

BigQuery - Fondamentaux

Data Cleaning - Nettoyage des données

KPIs et métriques business

Statistiques descriptives

Zapier et automatisation No-Code

Principes de data visualisation

Google Sheets - Dashboards automatisés

SQL - Sous-requêtes et CTEs

SQL - Window Functions

BigQuery - Fonctionnalités avancées

Data Modeling

Analyse de funnels et conversion

Analyse de cohortes et rétention

Google Tag Manager et tracking

APIs et webhooks

dbt - Fondamentaux

AB Testing et statistiques appliquées

Looker Studio (Google Data Studio)

Power BI - Fondamentaux

SQL - Requêtes analytiques avancées

dbt - Fonctionnalités avancées

Power BI - DAX et dashboards avancés

Python Analytics - Analyse avancée et ML

Maîtrise Data Analytics pour ton prochain entretien