
Arbres de décision & Ensembles
Decision Trees, Random Forest, Gradient Boosting, XGBoost, hyperparameter tuning, feature importance
1Qu'est-ce qu'un arbre de décision en Machine Learning ?
Qu'est-ce qu'un arbre de décision en Machine Learning ?
Réponse
Un arbre de décision est un modèle de Machine Learning qui effectue des prédictions en divisant les données selon des règles de décision hiérarchiques. Chaque noeud interne représente un test sur une feature, chaque branche représente le résultat du test, et chaque feuille représente une prédiction finale. Ce modèle est intuitif et facilement interprétable, ce qui en fait un excellent choix pour comprendre les facteurs influençant une décision.
2Quel critère est utilisé par défaut dans scikit-learn pour mesurer la qualité d'un split dans un arbre de classification ?
Quel critère est utilisé par défaut dans scikit-learn pour mesurer la qualité d'un split dans un arbre de classification ?
Réponse
L'indice de Gini est le critère par défaut dans scikit-learn pour les arbres de classification. Il mesure l'impureté d'un noeud en calculant la probabilité qu'un élément soit mal classé si on le classe aléatoirement selon la distribution des classes. Un Gini de 0 signifie un noeud pur (une seule classe), tandis qu'un Gini plus élevé indique une plus grande diversité de classes.
3Quelle est la principale différence entre l'indice de Gini et l'entropie comme critère de split ?
Quelle est la principale différence entre l'indice de Gini et l'entropie comme critère de split ?
Réponse
L'indice de Gini et l'entropie produisent généralement des arbres très similaires, mais Gini est légèrement plus rapide à calculer car il ne nécessite pas de calcul logarithmique. L'entropie, basée sur la théorie de l'information, peut parfois créer des splits légèrement plus équilibrés. En pratique, le choix entre les deux a rarement un impact significatif sur la performance du modèle.
Qu'est-ce que le pruning (élagage) dans le contexte des arbres de décision ?
Quel hyperparamètre contrôle la profondeur maximale d'un arbre de décision dans scikit-learn ?
+21 questions d'entretien
Autres sujets d'entretien Data Science & ML
Les bases de Python
Programmation Orientée Objet Python
Structures de données Python
Fondamentaux Git
Les bases de SQL
Fondamentaux NumPy
Les bases de Pandas
Jupyter & Google Colab
SQL Joins & Requêtes avancées
Pandas avancé
Visualisation avec Matplotlib & Seaborn
Visualisations interactives avec Plotly
Statistiques descriptives
Statistiques inférentielles
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML Supervisé : Régression
ML Supervisé : Classification
ML Non supervisé
Pipelines ML & Validation
Séries temporelles & Prévisions
Fondamentaux Deep Learning
TensorFlow & Keras
CNN & Classification d'images
RNN & Séquences
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps & Déploiement
Maîtrise Data Science & ML pour ton prochain entretien
Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.
Commencer gratuitement