Data Science & ML

Alberi Decisionali e Ensembles

Decision Trees, Random Forest, Gradient Boosting, XGBoost, tuning degli iperparametri, feature importance

24 domande da colloquio·
Mid-Level
1

Cos'è un decision tree nel Machine Learning?

Risposta

Un decision tree è un modello di Machine Learning che effettua previsioni dividendo i dati secondo regole decisionali gerarchiche. Ogni nodo interno rappresenta un test su una feature, ogni ramo rappresenta l'esito del test, e ogni foglia rappresenta una previsione finale. Questo modello è intuitivo e facilmente interpretabile, rendendolo una scelta eccellente per comprendere i fattori che influenzano una decisione.

2

Quale criterio è usato di default in scikit-learn per misurare la qualità di uno split in un albero di classificazione?

Risposta

L'indice di Gini è il criterio di default in scikit-learn per gli alberi di classificazione. Misura l'impurità di un nodo calcolando la probabilità che un elemento venga classificato erroneamente se classificato casualmente secondo la distribuzione delle classi. Un Gini di 0 significa un nodo puro (singola classe), mentre un Gini più alto indica maggiore diversità di classi.

3

Qual è la principale differenza tra l'indice di Gini e l'entropia come criteri di split?

Risposta

L'indice di Gini e l'entropia producono generalmente alberi molto simili, ma Gini è leggermente più veloce da calcolare poiché non richiede calcoli logaritmici. L'entropia, basata sulla teoria dell'informazione, può talvolta creare split leggermente più equilibrati. In pratica, la scelta tra i due ha raramente un impatto significativo sulle prestazioni del modello.

4

Cos'è il pruning nel contesto dei decision trees?

5

Quale iperparametro controlla la profondità massima di un decision tree in scikit-learn?

+21 domande da colloquio

Padroneggia Data Science & ML per il tuo prossimo colloquio

Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.

Inizia gratis