
Drzewa Decyzyjne i Ensembles
Decision Trees, Random Forest, Gradient Boosting, XGBoost, strojenie hiperparametrów, feature importance
1Czym jest decision tree w Machine Learning?
Czym jest decision tree w Machine Learning?
Odpowiedź
Decision tree to model Machine Learning, który dokonuje predykcji poprzez podział danych według hierarchicznych reguł decyzyjnych. Każdy węzeł wewnętrzny reprezentuje test na feature, każda gałąź reprezentuje wynik testu, a każdy liść reprezentuje końcową predykcję. Ten model jest intuicyjny i łatwo interpretowalny, co czyni go doskonałym wyborem do zrozumienia czynników wpływających na decyzję.
2Jakie kryterium jest używane domyślnie w scikit-learn do pomiaru jakości splitu w drzewie klasyfikacji?
Jakie kryterium jest używane domyślnie w scikit-learn do pomiaru jakości splitu w drzewie klasyfikacji?
Odpowiedź
Indeks Gini jest domyślnym kryterium w scikit-learn dla drzew klasyfikacji. Mierzy nieczystość węzła, obliczając prawdopodobieństwo, że element zostałby źle sklasyfikowany, gdyby został losowo sklasyfikowany według rozkładu klas. Gini równy 0 oznacza czysty węzeł (pojedyncza klasa), podczas gdy wyższy Gini wskazuje na większą różnorodność klas.
3Jaka jest główna różnica między indeksem Gini a entropią jako kryteriami splitu?
Jaka jest główna różnica między indeksem Gini a entropią jako kryteriami splitu?
Odpowiedź
Indeks Gini i entropia zazwyczaj tworzą bardzo podobne drzewa, ale Gini jest nieco szybszy do obliczenia, ponieważ nie wymaga obliczeń logarytmicznych. Entropia, oparta na teorii informacji, może czasem tworzyć nieco bardziej zrównoważone splity. W praktyce wybór między nimi rzadko ma znaczący wpływ na wydajność modelu.
Czym jest pruning w kontekście decision trees?
Który hiperparametr kontroluje maksymalną głębokość decision tree w scikit-learn?
+21 pytań z rozmów
Inne tematy rekrutacyjne Data Science & ML
Podstawy Pythona
Programowanie Obiektowe w Pythonie
Struktury danych Python
Podstawy Git
Podstawy SQL
Podstawy NumPy
Podstawy Pandas
Jupyter & Google Colab
SQL Joins i zaawansowane zapytania
Zaawansowany Pandas
Wizualizacja z Matplotlib & Seaborn
Interaktywne wizualizacje z Plotly
Statystyka opisowa
Statystyka inferencyjna
Web Scraping
BigQuery & Cloud Data
Feature Engineering
Uczenie nadzorowane: Regresja
Uczenie nadzorowane: Klasyfikacja
ML Nienadzorowane
Pipeline'y ML i walidacja
Szeregi czasowe i prognozowanie
Podstawy Deep Learning
TensorFlow & Keras
CNN i klasyfikacja obrazów
RNN i Sekwencje
Transformers i Attention
NLP i Hugging Face
GenAI i LangChain
MLOps i Wdrożenie
Opanuj Data Science & ML na następną rozmowę
Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.
Zacznij za darmo