Data Science & ML

Beslissingsbomen & Ensembles

Decision Trees, Random Forest, Gradient Boosting, XGBoost, hyperparameter tuning, feature importance

24 gespreksvragen·
Mid-Level
1

Wat is een decision tree in Machine Learning?

Antwoord

Een decision tree is een Machine Learning-model dat voorspellingen maakt door data te splitsen volgens hiërarchische beslisregels. Elke interne node vertegenwoordigt een test op een feature, elke tak vertegenwoordigt het resultaat van de test, en elk blad vertegenwoordigt een uiteindelijke voorspelling. Dit model is intuïtief en gemakkelijk interpreteerbaar, wat het een uitstekende keuze maakt om factoren die een beslissing beïnvloeden te begrijpen.

2

Welk criterium wordt standaard gebruikt in scikit-learn om de kwaliteit van een split in een classificatieboom te meten?

Antwoord

De Gini-index is het standaardcriterium in scikit-learn voor classificatiebomen. Het meet de onzuiverheid van een node door de waarschijnlijkheid te berekenen dat een element verkeerd zou worden geclassificeerd als het willekeurig wordt geclassificeerd volgens de klassendistributie. Een Gini van 0 betekent een zuivere node (enkele klasse), terwijl een hogere Gini wijst op grotere klassendiversiteit.

3

Wat is het belangrijkste verschil tussen Gini-index en entropie als splitcriteria?

Antwoord

Gini-index en entropie produceren over het algemeen zeer vergelijkbare bomen, maar Gini is iets sneller te berekenen omdat het geen logaritmische berekening vereist. Entropie, gebaseerd op informatietheorie, kan soms iets evenwichtigere splits creëren. In de praktijk heeft de keuze tussen beide zelden een significante impact op modelprestaties.

4

Wat is pruning in de context van decision trees?

5

Welke hyperparameter regelt de maximale diepte van een decision tree in scikit-learn?

+21 gespreksvragen

Beheers Data Science & ML voor je volgende gesprek

Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.

Begin gratis