Data Science & ML

Karar Ağaçları ve Topluluk Yöntemleri

Decision Trees, Random Forest, Gradient Boosting, XGBoost, hiperparametre ayarı, feature importance

24 mülakat soruları·
Mid-Level
1

Machine Learning'de decision tree nedir?

Cevap

Decision tree, hiyerarşik karar kurallarına göre verileri bölerek tahminler yapan bir Machine Learning modelidir. Her iç düğüm bir feature üzerinde test temsil eder, her dal testin sonucunu temsil eder ve her yaprak nihai bir tahmini temsil eder. Bu model sezgisel ve kolayca yorumlanabilir olup, bir kararı etkileyen faktörleri anlamak için mükemmel bir seçimdir.

2

scikit-learn'de sınıflandırma ağacındaki bir split'in kalitesini ölçmek için varsayılan olarak hangi kriter kullanılır?

Cevap

Gini indeksi, scikit-learn'de classification trees için varsayılan kriterdir. Bir elemanın sınıf dağılımına göre rastgele sınıflandırılması durumunda yanlış sınıflandırılma olasılığını hesaplayarak bir düğümün saflığını ölçer. Gini 0 ise saf düğüm (tek sınıf) anlamına gelir, daha yüksek Gini ise daha fazla sınıf çeşitliliğini gösterir.

3

Split kriteri olarak Gini indeksi ile entropi arasındaki temel fark nedir?

Cevap

Gini indeksi ve entropi genellikle çok benzer ağaçlar üretir, ancak Gini logaritmik hesaplama gerektirmediğinden hesaplaması biraz daha hızlıdır. Bilgi teorisine dayanan entropi, bazen biraz daha dengeli split'ler oluşturabilir. Pratikte, ikisi arasındaki seçim nadiren model performansı üzerinde önemli bir etkiye sahiptir.

4

Decision tree bağlamında pruning nedir?

5

scikit-learn'de bir decision tree'nin maksimum derinliğini hangi hiperparametre kontrol eder?

+21 mülakat soruları

Bir sonraki mülakatın için Data Science & ML'de uzmanlaş

Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.

Ücretsiz başla