Data Science & ML

Arbres de décision & Ensembles

Decision Trees, Random Forest, Gradient Boosting, XGBoost, hyperparameter tuning, feature importance

24 questions d'entretien·
Confirmé
1

Qu'est-ce qu'un arbre de décision en Machine Learning ?

Réponse

Un arbre de décision est un modèle de Machine Learning qui effectue des prédictions en divisant les données selon des règles de décision hiérarchiques. Chaque noeud interne représente un test sur une feature, chaque branche représente le résultat du test, et chaque feuille représente une prédiction finale. Ce modèle est intuitif et facilement interprétable, ce qui en fait un excellent choix pour comprendre les facteurs influençant une décision.

2

Quel critère est utilisé par défaut dans scikit-learn pour mesurer la qualité d'un split dans un arbre de classification ?

Réponse

L'indice de Gini est le critère par défaut dans scikit-learn pour les arbres de classification. Il mesure l'impureté d'un noeud en calculant la probabilité qu'un élément soit mal classé si on le classe aléatoirement selon la distribution des classes. Un Gini de 0 signifie un noeud pur (une seule classe), tandis qu'un Gini plus élevé indique une plus grande diversité de classes.

3

Quelle est la principale différence entre l'indice de Gini et l'entropie comme critère de split ?

Réponse

L'indice de Gini et l'entropie produisent généralement des arbres très similaires, mais Gini est légèrement plus rapide à calculer car il ne nécessite pas de calcul logarithmique. L'entropie, basée sur la théorie de l'information, peut parfois créer des splits légèrement plus équilibrés. En pratique, le choix entre les deux a rarement un impact significatif sur la performance du modèle.

4

Qu'est-ce que le pruning (élagage) dans le contexte des arbres de décision ?

5

Quel hyperparamètre contrôle la profondeur maximale d'un arbre de décision dans scikit-learn ?

+21 questions d'entretien

Maîtrise Data Science & ML pour ton prochain entretien

Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.

Commencer gratuitement