Data Science & ML

ML Tanpa Pengawasan

K-Means, hierarchical clustering, DBSCAN, PCA, t-SNE, UMAP, silhouette score, elbow method

22 pertanyaan wawancaraยท
Mid-Level
1

Apa perbedaan utama antara supervised learning dan unsupervised learning?

Jawaban

Unsupervised learning bekerja dengan data tanpa label, mencari untuk menemukan struktur atau pola tersembunyi tanpa variabel target yang ditentukan sebelumnya. Tidak seperti supervised learning yang memprediksi nilai yang diketahui (label), unsupervised learning mengeksplorasi data untuk menemukan grup alami, mengurangi dimensi, atau mendeteksi anomali. Algoritma seperti K-Means, PCA, atau DBSCAN adalah contoh khas unsupervised learning.

2

Bagaimana algoritma K-Means bekerja untuk mempartisi data?

Jawaban

K-Means adalah algoritma iteratif yang mempartisi data ke dalam K cluster. Ia menginisialisasi K centroid secara acak, lalu bergantian antara dua langkah: menetapkan setiap titik ke centroid terdekat (langkah assignment) dan menghitung ulang posisi centroid sebagai rata-rata titik yang ditetapkan (langkah update). Algoritma konvergen ketika assignment tidak lagi berubah atau setelah jumlah iterasi maksimum.

3

Metode apa yang digunakan untuk menentukan jumlah cluster K optimal di K-Means?

Jawaban

Elbow method memplot inertia (jumlah jarak kuadrat antara setiap titik dan centroidnya) terhadap K. Titik di mana kurva membentuk siku menunjukkan K optimal, karena di luar itu menambah cluster tidak lagi secara signifikan meningkatkan inertia. Metode ini dilengkapi dengan silhouette score untuk memvalidasi kualitas cluster.

4

Apa yang diukur silhouette score dalam konteks clustering?

5

Apa rentang nilai silhouette score dan bagaimana menginterpretasikan skor 0.7?

+19 pertanyaan wawancara

Kuasai Data Science & ML untuk wawancara berikutnya

Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.

Mulai gratis