Data Science & ML

Drzewa Decyzyjne i Ensembles

Decision Trees, Random Forest, Gradient Boosting, XGBoost, strojenie hiperparametrów, feature importance

24 pytań z rozmów·
Mid-Level
1

Czym jest decision tree w Machine Learning?

Odpowiedź

Decision tree to model Machine Learning, który dokonuje predykcji poprzez podział danych według hierarchicznych reguł decyzyjnych. Każdy węzeł wewnętrzny reprezentuje test na feature, każda gałąź reprezentuje wynik testu, a każdy liść reprezentuje końcową predykcję. Ten model jest intuicyjny i łatwo interpretowalny, co czyni go doskonałym wyborem do zrozumienia czynników wpływających na decyzję.

2

Jakie kryterium jest używane domyślnie w scikit-learn do pomiaru jakości splitu w drzewie klasyfikacji?

Odpowiedź

Indeks Gini jest domyślnym kryterium w scikit-learn dla drzew klasyfikacji. Mierzy nieczystość węzła, obliczając prawdopodobieństwo, że element zostałby źle sklasyfikowany, gdyby został losowo sklasyfikowany według rozkładu klas. Gini równy 0 oznacza czysty węzeł (pojedyncza klasa), podczas gdy wyższy Gini wskazuje na większą różnorodność klas.

3

Jaka jest główna różnica między indeksem Gini a entropią jako kryteriami splitu?

Odpowiedź

Indeks Gini i entropia zazwyczaj tworzą bardzo podobne drzewa, ale Gini jest nieco szybszy do obliczenia, ponieważ nie wymaga obliczeń logarytmicznych. Entropia, oparta na teorii informacji, może czasem tworzyć nieco bardziej zrównoważone splity. W praktyce wybór między nimi rzadko ma znaczący wpływ na wydajność modelu.

4

Czym jest pruning w kontekście decision trees?

5

Który hiperparametr kontroluje maksymalną głębokość decision tree w scikit-learn?

+21 pytań z rozmów

Opanuj Data Science & ML na następną rozmowę

Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.

Zacznij za darmo