Data Science & ML

Pohon Keputusan & Ensemble

Decision Trees, Random Forest, Gradient Boosting, XGBoost, hyperparameter tuning, feature importance

24 pertanyaan wawancaraยท
Mid-Level
1

Apa itu decision tree dalam Machine Learning?

Jawaban

Decision tree adalah model Machine Learning yang membuat prediksi dengan membagi data menurut aturan keputusan hierarkis. Setiap node internal mewakili pengujian pada sebuah feature, setiap cabang mewakili hasil pengujian, dan setiap leaf mewakili prediksi akhir. Model ini intuitif dan mudah diinterpretasikan, menjadikannya pilihan yang sangat baik untuk memahami faktor-faktor yang mempengaruhi suatu keputusan.

2

Kriteria apa yang digunakan secara default di scikit-learn untuk mengukur kualitas split di classification tree?

Jawaban

Gini index adalah kriteria default di scikit-learn untuk classification trees. Ini mengukur ketidakmurnian sebuah node dengan menghitung probabilitas bahwa sebuah elemen akan salah diklasifikasikan jika diklasifikasikan secara acak menurut distribusi kelas. Gini 0 berarti node murni (kelas tunggal), sedangkan Gini yang lebih tinggi menunjukkan keragaman kelas yang lebih besar.

3

Apa perbedaan utama antara Gini index dan entropi sebagai kriteria split?

Jawaban

Gini index dan entropi umumnya menghasilkan pohon yang sangat mirip, tetapi Gini sedikit lebih cepat dihitung karena tidak memerlukan perhitungan logaritmik. Entropi, yang berdasarkan teori informasi, kadang dapat menciptakan split yang sedikit lebih seimbang. Dalam praktiknya, pilihan antara keduanya jarang memiliki dampak signifikan pada performa model.

4

Apa itu pruning dalam konteks decision trees?

5

Hyperparameter mana yang mengontrol kedalaman maksimum decision tree di scikit-learn?

+21 pertanyaan wawancara

Kuasai Data Science & ML untuk wawancara berikutnya

Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.

Mulai gratis