
Pohon Keputusan & Ensemble
Decision Trees, Random Forest, Gradient Boosting, XGBoost, hyperparameter tuning, feature importance
1Apa itu decision tree dalam Machine Learning?
Apa itu decision tree dalam Machine Learning?
Jawaban
Decision tree adalah model Machine Learning yang membuat prediksi dengan membagi data menurut aturan keputusan hierarkis. Setiap node internal mewakili pengujian pada sebuah feature, setiap cabang mewakili hasil pengujian, dan setiap leaf mewakili prediksi akhir. Model ini intuitif dan mudah diinterpretasikan, menjadikannya pilihan yang sangat baik untuk memahami faktor-faktor yang mempengaruhi suatu keputusan.
2Kriteria apa yang digunakan secara default di scikit-learn untuk mengukur kualitas split di classification tree?
Kriteria apa yang digunakan secara default di scikit-learn untuk mengukur kualitas split di classification tree?
Jawaban
Gini index adalah kriteria default di scikit-learn untuk classification trees. Ini mengukur ketidakmurnian sebuah node dengan menghitung probabilitas bahwa sebuah elemen akan salah diklasifikasikan jika diklasifikasikan secara acak menurut distribusi kelas. Gini 0 berarti node murni (kelas tunggal), sedangkan Gini yang lebih tinggi menunjukkan keragaman kelas yang lebih besar.
3Apa perbedaan utama antara Gini index dan entropi sebagai kriteria split?
Apa perbedaan utama antara Gini index dan entropi sebagai kriteria split?
Jawaban
Gini index dan entropi umumnya menghasilkan pohon yang sangat mirip, tetapi Gini sedikit lebih cepat dihitung karena tidak memerlukan perhitungan logaritmik. Entropi, yang berdasarkan teori informasi, kadang dapat menciptakan split yang sedikit lebih seimbang. Dalam praktiknya, pilihan antara keduanya jarang memiliki dampak signifikan pada performa model.
Apa itu pruning dalam konteks decision trees?
Hyperparameter mana yang mengontrol kedalaman maksimum decision tree di scikit-learn?
+21 pertanyaan wawancara
Topik wawancara Data Science & ML lainnya
Dasar-dasar Python
Pemrograman Berorientasi Objek Python
Struktur Data Python
Dasar-Dasar Git
Dasar-dasar SQL
Dasar-Dasar NumPy
Dasar-dasar Pandas
Jupyter & Google Colab
SQL Joins & Kueri Lanjutan
Pandas Lanjutan
Visualisasi dengan Matplotlib & Seaborn
Visualisasi Interaktif dengan Plotly
Statistik Deskriptif
Statistik Inferensial
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML Terbimbing: Regresi
ML Terbimbing: Klasifikasi
ML Tanpa Pengawasan
Pipeline ML & Validasi
Deret Waktu & Peramalan
Dasar-Dasar Deep Learning
TensorFlow & Keras
CNN dan klasifikasi gambar
RNN & Sekuens
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps dan Deployment
Kuasai Data Science & ML untuk wawancara berikutnya
Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.
Mulai gratis