
Les bases de Pandas
DataFrames, Series, indexation, sélection, filtrage, valeurs manquantes, types de données
1Quelle est la structure de données principale de Pandas pour stocker des données tabulaires avec des lignes et des colonnes nommées ?
Quelle est la structure de données principale de Pandas pour stocker des données tabulaires avec des lignes et des colonnes nommées ?
Réponse
Le DataFrame est la structure de données centrale de Pandas, conçue pour stocker des données tabulaires bidimensionnelles. Chaque colonne peut contenir un type de données différent, et les lignes comme les colonnes possèdent des étiquettes (index). Cette structure est similaire à une feuille de calcul Excel ou une table SQL, ce qui facilite la manipulation de données structurées.
2Quelle structure Pandas représente une seule colonne de données avec un index ?
Quelle structure Pandas représente une seule colonne de données avec un index ?
Réponse
Une Series est une structure unidimensionnelle qui peut contenir n'importe quel type de données (entiers, chaînes, flottants, objets Python). Chaque élément possède un index associé, ce qui permet d'accéder aux valeurs par leur étiquette. Une colonne extraite d'un DataFrame est automatiquement convertie en Series.
3Comment créer un DataFrame à partir d'un dictionnaire Python où les clés deviennent les noms de colonnes ?
Comment créer un DataFrame à partir d'un dictionnaire Python où les clés deviennent les noms de colonnes ?
Réponse
La fonction pd.DataFrame() accepte directement un dictionnaire Python. Les clés du dictionnaire deviennent automatiquement les noms des colonnes, et les valeurs (listes ou arrays) deviennent les données de chaque colonne. Cette méthode est la plus courante pour créer des DataFrames à partir de données structurées en Python.
Quelle méthode utiliser pour lire un fichier CSV et le charger dans un DataFrame ?
Quelle méthode affiche les premières lignes d'un DataFrame pour un aperçu rapide des données ?
+19 questions d'entretien
Autres sujets d'entretien Data Science & ML
Les bases de Python
Programmation Orientée Objet Python
Structures de données Python
Fondamentaux Git
Les bases de SQL
Fondamentaux NumPy
Jupyter & Google Colab
SQL Joins & Requêtes avancées
Pandas avancé
Visualisation avec Matplotlib & Seaborn
Visualisations interactives avec Plotly
Statistiques descriptives
Statistiques inférentielles
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML Supervisé : Régression
ML Supervisé : Classification
Arbres de décision & Ensembles
ML Non supervisé
Pipelines ML & Validation
Séries temporelles & Prévisions
Fondamentaux Deep Learning
TensorFlow & Keras
CNN & Classification d'images
RNN & Séquences
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps & Déploiement
Maîtrise Data Science & ML pour ton prochain entretien
Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.
Commencer gratuitement