
Karar Ağaçları ve Topluluk Yöntemleri
Decision Trees, Random Forest, Gradient Boosting, XGBoost, hiperparametre ayarı, feature importance
1Machine Learning'de decision tree nedir?
Machine Learning'de decision tree nedir?
Cevap
Decision tree, hiyerarşik karar kurallarına göre verileri bölerek tahminler yapan bir Machine Learning modelidir. Her iç düğüm bir feature üzerinde test temsil eder, her dal testin sonucunu temsil eder ve her yaprak nihai bir tahmini temsil eder. Bu model sezgisel ve kolayca yorumlanabilir olup, bir kararı etkileyen faktörleri anlamak için mükemmel bir seçimdir.
2scikit-learn'de sınıflandırma ağacındaki bir split'in kalitesini ölçmek için varsayılan olarak hangi kriter kullanılır?
scikit-learn'de sınıflandırma ağacındaki bir split'in kalitesini ölçmek için varsayılan olarak hangi kriter kullanılır?
Cevap
Gini indeksi, scikit-learn'de classification trees için varsayılan kriterdir. Bir elemanın sınıf dağılımına göre rastgele sınıflandırılması durumunda yanlış sınıflandırılma olasılığını hesaplayarak bir düğümün saflığını ölçer. Gini 0 ise saf düğüm (tek sınıf) anlamına gelir, daha yüksek Gini ise daha fazla sınıf çeşitliliğini gösterir.
3Split kriteri olarak Gini indeksi ile entropi arasındaki temel fark nedir?
Split kriteri olarak Gini indeksi ile entropi arasındaki temel fark nedir?
Cevap
Gini indeksi ve entropi genellikle çok benzer ağaçlar üretir, ancak Gini logaritmik hesaplama gerektirmediğinden hesaplaması biraz daha hızlıdır. Bilgi teorisine dayanan entropi, bazen biraz daha dengeli split'ler oluşturabilir. Pratikte, ikisi arasındaki seçim nadiren model performansı üzerinde önemli bir etkiye sahiptir.
Decision tree bağlamında pruning nedir?
scikit-learn'de bir decision tree'nin maksimum derinliğini hangi hiperparametre kontrol eder?
+21 mülakat soruları
Diğer Data Science & ML mülakat konuları
Python Temelleri
Python Nesne Yönelimli Programlama
Python Veri Yapıları
Git Temelleri
SQL Temelleri
NumPy Temelleri
Pandas Temelleri
Jupyter & Google Colab
SQL Joins ve Gelişmiş Sorgular
İleri Pandas
Matplotlib & Seaborn ile Görselleştirme
Plotly ile Etkileşimli Görselleştirmeler
Tanımlayıcı İstatistik
Çıkarımsal İstatistik
Web Scraping
BigQuery & Cloud Data
Feature Engineering
Denetimli ML: Regresyon
Denetimli ML: Sınıflandırma
Denetimsiz ML
ML Pipeline'ları & Doğrulama
Zaman Serileri & Tahminleme
Deep Learning Temelleri
TensorFlow & Keras
CNN ve görüntü sınıflandırma
RNN ve Diziler
Transformers ve Attention
NLP ve Hugging Face
GenAI ve LangChain
MLOps ve Dağıtım
Bir sonraki mülakatın için Data Science & ML'de uzmanlaş
Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.
Ücretsiz başla