
Python Analytics - Analyse avancée et ML
groupby, merge, pivot_table, apply/map, Plotly, Scikit-Learn (régression, classification, clustering), train/test split, métriques, Jupyter, Google Colab
1Quelle est la différence principale entre les méthodes apply() et map() sur une Series Pandas ?
Quelle est la différence principale entre les méthodes apply() et map() sur une Series Pandas ?
Réponse
La méthode map() est conçue pour mapper chaque valeur d'une Series à une nouvelle valeur via un dictionnaire ou une fonction, et fonctionne uniquement sur les Series. En revanche, apply() est plus flexible : elle peut appliquer une fonction élément par élément sur une Series ou ligne par ligne / colonne par colonne sur un DataFrame. Pour des transformations simples valeur par valeur sur une Series, map() est généralement plus rapide et plus lisible.
2Quelle méthode Pandas utiliser pour agréger des données avec plusieurs fonctions d'agrégation sur différentes colonnes simultanément ?
Quelle méthode Pandas utiliser pour agréger des données avec plusieurs fonctions d'agrégation sur différentes colonnes simultanément ?
Réponse
La méthode agg() (ou aggregate()) permet d'appliquer différentes fonctions d'agrégation à différentes colonnes en une seule opération. Elle accepte un dictionnaire où les clés sont les noms de colonnes et les valeurs sont les fonctions à appliquer. Cette approche est plus efficace et lisible que d'enchaîner plusieurs appels groupby avec des fonctions individuelles.
3Quelle est la différence entre merge() et join() dans Pandas ?
Quelle est la différence entre merge() et join() dans Pandas ?
Réponse
merge() est une fonction plus flexible qui joint deux DataFrames sur des colonnes spécifiques avec le paramètre on, left_on/right_on, ou des index. join() est une méthode de DataFrame qui joint par défaut sur les index et est plus concise pour les jointures simples basées sur les index. Pour des jointures complexes sur des colonnes non-index, merge() est préférable car il offre plus de contrôle sur les colonnes de jointure.
Comment créer un tableau croisé dynamique avec pivot_table() en spécifiant plusieurs fonctions d'agrégation ?
Quelle est la fonction de transform() dans un contexte groupby() par rapport à apply() ?
+17 questions d'entretien
Autres sujets d'entretien Data Analytics
Google Sheets - Les fondamentaux
Google Sheets - Formules avancées
SQL - Les fondamentaux
SQL - Agrégations et groupements
SQL - Jointures
BigQuery - Fondamentaux
Data Cleaning - Nettoyage des données
KPIs et métriques business
Statistiques descriptives
Zapier et automatisation No-Code
Principes de data visualisation
Python & Pandas - Fondamentaux
Google Sheets - Dashboards automatisés
SQL - Sous-requêtes et CTEs
SQL - Window Functions
BigQuery - Fonctionnalités avancées
Data Modeling
Analyse de funnels et conversion
Analyse de cohortes et rétention
Google Tag Manager et tracking
APIs et webhooks
dbt - Fondamentaux
AB Testing et statistiques appliquées
Looker Studio (Google Data Studio)
Power BI - Fondamentaux
SQL - Requêtes analytiques avancées
dbt - Fonctionnalités avancées
Power BI - DAX et dashboards avancés
Maîtrise Data Analytics pour ton prochain entretien
Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.
Commencer gratuitement