
Entscheidungsbäume & Ensembles
Decision Trees, Random Forest, Gradient Boosting, XGBoost, Hyperparameter-Tuning, Feature Importance
1Was ist ein Decision Tree im Machine Learning?
Was ist ein Decision Tree im Machine Learning?
Antwort
Ein Decision Tree ist ein Machine-Learning-Modell, das Vorhersagen trifft, indem es Daten anhand hierarchischer Entscheidungsregeln aufteilt. Jeder interne Knoten repräsentiert einen Test auf einem Feature, jeder Zweig repräsentiert das Ergebnis des Tests, und jedes Blatt repräsentiert eine endgültige Vorhersage. Dieses Modell ist intuitiv und leicht interpretierbar, was es zu einer ausgezeichneten Wahl macht, um die eine Entscheidung beeinflussenden Faktoren zu verstehen.
2Welches Kriterium wird in scikit-learn standardmäßig verwendet, um die Qualität eines Splits in einem Klassifikationsbaum zu messen?
Welches Kriterium wird in scikit-learn standardmäßig verwendet, um die Qualität eines Splits in einem Klassifikationsbaum zu messen?
Antwort
Der Gini-Index ist das Standardkriterium in scikit-learn für Klassifikationsbäume. Er misst die Unreinheit eines Knotens, indem er die Wahrscheinlichkeit berechnet, dass ein Element fehlklassifiziert würde, wenn es zufällig gemäß der Klassenverteilung klassifiziert würde. Ein Gini von 0 bedeutet einen reinen Knoten (einzelne Klasse), während ein höherer Gini-Wert eine größere Klassenvielfalt anzeigt.
3Was ist der Hauptunterschied zwischen Gini-Index und Entropie als Split-Kriterien?
Was ist der Hauptunterschied zwischen Gini-Index und Entropie als Split-Kriterien?
Antwort
Der Gini-Index und die Entropie erzeugen im Allgemeinen sehr ähnliche Bäume, aber Gini ist etwas schneller zu berechnen, da keine logarithmische Berechnung erforderlich ist. Die Entropie, die auf der Informationstheorie basiert, kann manchmal etwas ausgewogenere Splits erzeugen. In der Praxis hat die Wahl zwischen beiden selten einen signifikanten Einfluss auf die Modellleistung.
Was ist Pruning im Kontext von Decision Trees?
Welcher Hyperparameter steuert die maximale Tiefe eines Decision Trees in scikit-learn?
+21 Interview-Fragen
Weitere Data Science & ML-Interviewthemen
Python-Grundlagen
Python Objektorientierte Programmierung
Python-Datenstrukturen
Git-Grundlagen
SQL-Grundlagen
NumPy-Grundlagen
Pandas-Grundlagen
Jupyter & Google Colab
SQL Joins & fortgeschrittene Abfragen
Fortgeschrittenes Pandas
Visualisierung mit Matplotlib & Seaborn
Interaktive Visualisierungen mit Plotly
Deskriptive Statistik
Inferenzstatistik
Web Scraping
BigQuery & Cloud Data
Feature Engineering
Überwachtes ML: Regression
Überwachtes ML: Klassifikation
Unüberwachtes ML
ML-Pipelines & Validierung
Zeitreihen & Prognosen
Grundlagen des Deep Learning
TensorFlow & Keras
CNN und Bildklassifizierung
RNN & Sequenzen
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps und Deployment
Meistere Data Science & ML für dein nächstes Interview
Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.
Kostenlos starten