Data Science & ML

Entscheidungsbäume & Ensembles

Decision Trees, Random Forest, Gradient Boosting, XGBoost, Hyperparameter-Tuning, Feature Importance

24 Interview-Fragen·
Mid-Level
1

Was ist ein Decision Tree im Machine Learning?

Antwort

Ein Decision Tree ist ein Machine-Learning-Modell, das Vorhersagen trifft, indem es Daten anhand hierarchischer Entscheidungsregeln aufteilt. Jeder interne Knoten repräsentiert einen Test auf einem Feature, jeder Zweig repräsentiert das Ergebnis des Tests, und jedes Blatt repräsentiert eine endgültige Vorhersage. Dieses Modell ist intuitiv und leicht interpretierbar, was es zu einer ausgezeichneten Wahl macht, um die eine Entscheidung beeinflussenden Faktoren zu verstehen.

2

Welches Kriterium wird in scikit-learn standardmäßig verwendet, um die Qualität eines Splits in einem Klassifikationsbaum zu messen?

Antwort

Der Gini-Index ist das Standardkriterium in scikit-learn für Klassifikationsbäume. Er misst die Unreinheit eines Knotens, indem er die Wahrscheinlichkeit berechnet, dass ein Element fehlklassifiziert würde, wenn es zufällig gemäß der Klassenverteilung klassifiziert würde. Ein Gini von 0 bedeutet einen reinen Knoten (einzelne Klasse), während ein höherer Gini-Wert eine größere Klassenvielfalt anzeigt.

3

Was ist der Hauptunterschied zwischen Gini-Index und Entropie als Split-Kriterien?

Antwort

Der Gini-Index und die Entropie erzeugen im Allgemeinen sehr ähnliche Bäume, aber Gini ist etwas schneller zu berechnen, da keine logarithmische Berechnung erforderlich ist. Die Entropie, die auf der Informationstheorie basiert, kann manchmal etwas ausgewogenere Splits erzeugen. In der Praxis hat die Wahl zwischen beiden selten einen signifikanten Einfluss auf die Modellleistung.

4

Was ist Pruning im Kontext von Decision Trees?

5

Welcher Hyperparameter steuert die maximale Tiefe eines Decision Trees in scikit-learn?

+21 Interview-Fragen

Meistere Data Science & ML für dein nächstes Interview

Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.

Kostenlos starten