
ML Tanpa Pengawasan
K-Means, hierarchical clustering, DBSCAN, PCA, t-SNE, UMAP, silhouette score, elbow method
1Apa perbedaan utama antara supervised learning dan unsupervised learning?
Apa perbedaan utama antara supervised learning dan unsupervised learning?
Jawaban
Unsupervised learning bekerja dengan data tanpa label, mencari untuk menemukan struktur atau pola tersembunyi tanpa variabel target yang ditentukan sebelumnya. Tidak seperti supervised learning yang memprediksi nilai yang diketahui (label), unsupervised learning mengeksplorasi data untuk menemukan grup alami, mengurangi dimensi, atau mendeteksi anomali. Algoritma seperti K-Means, PCA, atau DBSCAN adalah contoh khas unsupervised learning.
2Bagaimana algoritma K-Means bekerja untuk mempartisi data?
Bagaimana algoritma K-Means bekerja untuk mempartisi data?
Jawaban
K-Means adalah algoritma iteratif yang mempartisi data ke dalam K cluster. Ia menginisialisasi K centroid secara acak, lalu bergantian antara dua langkah: menetapkan setiap titik ke centroid terdekat (langkah assignment) dan menghitung ulang posisi centroid sebagai rata-rata titik yang ditetapkan (langkah update). Algoritma konvergen ketika assignment tidak lagi berubah atau setelah jumlah iterasi maksimum.
3Metode apa yang digunakan untuk menentukan jumlah cluster K optimal di K-Means?
Metode apa yang digunakan untuk menentukan jumlah cluster K optimal di K-Means?
Jawaban
Elbow method memplot inertia (jumlah jarak kuadrat antara setiap titik dan centroidnya) terhadap K. Titik di mana kurva membentuk siku menunjukkan K optimal, karena di luar itu menambah cluster tidak lagi secara signifikan meningkatkan inertia. Metode ini dilengkapi dengan silhouette score untuk memvalidasi kualitas cluster.
Apa yang diukur silhouette score dalam konteks clustering?
Apa rentang nilai silhouette score dan bagaimana menginterpretasikan skor 0.7?
+19 pertanyaan wawancara
Topik wawancara Data Science & ML lainnya
Dasar-dasar Python
Pemrograman Berorientasi Objek Python
Struktur Data Python
Dasar-Dasar Git
Dasar-dasar SQL
Dasar-Dasar NumPy
Dasar-dasar Pandas
Jupyter & Google Colab
SQL Joins & Kueri Lanjutan
Pandas Lanjutan
Visualisasi dengan Matplotlib & Seaborn
Visualisasi Interaktif dengan Plotly
Statistik Deskriptif
Statistik Inferensial
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML Terbimbing: Regresi
ML Terbimbing: Klasifikasi
Pohon Keputusan & Ensemble
Pipeline ML & Validasi
Deret Waktu & Peramalan
Dasar-Dasar Deep Learning
TensorFlow & Keras
CNN dan klasifikasi gambar
RNN & Sekuens
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps dan Deployment
Kuasai Data Science & ML untuk wawancara berikutnya
Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.
Mulai gratis