Question 1

Apa perbedaan utama antara supervised learning dan unsupervised learning?

Accepted Answer

Unsupervised learning bekerja dengan data tanpa label, mencari untuk menemukan struktur atau pola tersembunyi tanpa variabel target yang ditentukan sebelumnya. Tidak seperti supervised learning yang memprediksi nilai yang diketahui (label), unsupervised learning mengeksplorasi data untuk menemukan grup alami, mengurangi dimensi, atau mendeteksi anomali. Algoritma seperti K-Means, PCA, atau DBSCAN adalah contoh khas unsupervised learning.

Question 2

Bagaimana algoritma K-Means bekerja untuk mempartisi data?

Accepted Answer

K-Means adalah algoritma iteratif yang mempartisi data ke dalam K cluster. Ia menginisialisasi K centroid secara acak, lalu bergantian antara dua langkah: menetapkan setiap titik ke centroid terdekat (langkah assignment) dan menghitung ulang posisi centroid sebagai rata-rata titik yang ditetapkan (langkah update). Algoritma konvergen ketika assignment tidak lagi berubah atau setelah jumlah iterasi maksimum.

Question 3

Metode apa yang digunakan untuk menentukan jumlah cluster K optimal di K-Means?

Accepted Answer

Elbow method memplot inertia (jumlah jarak kuadrat antara setiap titik dan centroidnya) terhadap K. Titik di mana kurva membentuk siku menunjukkan K optimal, karena di luar itu menambah cluster tidak lagi secara signifikan meningkatkan inertia. Metode ini dilengkapi dengan silhouette score untuk memvalidasi kualitas cluster.

ML Tanpa Pengawasan

Apa perbedaan utama antara supervised learning dan unsupervised learning?

Jawaban

Bagaimana algoritma K-Means bekerja untuk mempartisi data?

Jawaban

Metode apa yang digunakan untuk menentukan jumlah cluster K optimal di K-Means?

Jawaban

Apa yang diukur silhouette score dalam konteks clustering?

Apa rentang nilai silhouette score dan bagaimana menginterpretasikan skor 0.7?

Topik wawancara Data Science & ML lainnya

Dasar-dasar Python

Pemrograman Berorientasi Objek Python

Struktur Data Python

Dasar-Dasar Git

Dasar-dasar SQL

Dasar-Dasar NumPy

Dasar-dasar Pandas

Jupyter & Google Colab

SQL Joins & Kueri Lanjutan

Pandas Lanjutan

Visualisasi dengan Matplotlib & Seaborn

Visualisasi Interaktif dengan Plotly

Statistik Deskriptif

Statistik Inferensial

Web Scraping

BigQuery & Cloud Data

Feature Engineering

ML Terbimbing: Regresi

ML Terbimbing: Klasifikasi

Pohon Keputusan & Ensemble

Pipeline ML & Validasi

Deret Waktu & Peramalan

Dasar-Dasar Deep Learning

TensorFlow & Keras

CNN dan klasifikasi gambar

RNN & Sekuens

Transformers & Attention

NLP & Hugging Face

GenAI & LangChain

MLOps dan Deployment

Kuasai Data Science & ML untuk wawancara berikutnya