Data Science & ML

Pandas avancé

GroupBy, merge, concat, pivot tables, time series, apply/transform, MultiIndex, performance

24 questions d'entretien·
Confirmé
1

Quelle méthode permet d'appliquer plusieurs fonctions d'agrégation différentes sur une seule colonne avec groupby ?

Réponse

La méthode agg() (ou aggregate()) permet d'appliquer plusieurs fonctions d'agrégation sur les mêmes colonnes. On peut passer une liste de fonctions comme ['sum', 'mean', 'count'] ou un dictionnaire pour spécifier des fonctions différentes par colonne. Cette flexibilité est essentielle pour créer des rapports statistiques complets en une seule opération.

2

Comment nommer explicitement les colonnes résultantes lors d'une agrégation avec groupby en utilisant la syntaxe named aggregation ?

Réponse

La syntaxe named aggregation utilise agg() avec des tuples nommés via des keyword arguments. Par exemple : df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')). Cette approche produit des noms de colonnes explicites et lisibles, évitant les MultiIndex dans les colonnes qui peuvent compliquer les traitements ultérieurs.

3

Quelle est la différence principale entre transform() et apply() dans un contexte groupby ?

Réponse

transform() retourne un résultat de la même taille que l'entrée, aligné sur l'index original, idéal pour ajouter des statistiques de groupe à chaque ligne (ex: moyenne du groupe). apply() est plus flexible et peut retourner un résultat de taille différente, mais est généralement plus lent. Utiliser transform() pour des opérations comme la normalisation par groupe ou le calcul de z-scores.

4

Comment filtrer les groupes dans un groupby pour ne garder que ceux qui satisfont une condition (par exemple, groupes avec plus de 10 éléments) ?

5

Quelle est la différence entre pd.merge() avec how='left' et how='inner' ?

+21 questions d'entretien

Maîtrise Data Science & ML pour ton prochain entretien

Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.

Commencer gratuitement