
Statistik Deskriptif
Mean, median, standar deviasi, kuartil, distribusi, korelasi, outlier, skewness
1Ukuran tendensi sentral mana yang paling tepat untuk data yang mengandung nilai ekstrem (outlier)?
Ukuran tendensi sentral mana yang paling tepat untuk data yang mengandung nilai ekstrem (outlier)?
Jawaban
Median adalah ukuran tendensi sentral yang paling robust terhadap outlier karena merepresentasikan nilai tengah dari data yang telah diurutkan, tanpa terpengaruh oleh nilai ekstrem. Tidak seperti mean yang menjumlahkan semua nilai, median hanya mempertimbangkan posisi. Misalnya, untuk gaji perusahaan dengan beberapa eksekutif bergaji tinggi, median memberikan representasi gaji tipikal yang lebih baik daripada mean.
2Apa itu varians dari sebuah dataset?
Apa itu varians dari sebuah dataset?
Jawaban
Varians mengukur dispersi data di sekitar mean-nya. Dihitung sebagai rata-rata dari kuadrat penyimpangan dari mean. Dengan mengkuadratkan, kita mendapatkan nilai yang selalu positif dan memperkuat dampak nilai yang jauh dari mean. Satuan varians adalah kuadrat dari satuan data asli, itulah mengapa kita sering menggunakan standar deviasi (akar kuadrat dari varians) untuk menafsirkan dispersi dalam satuan asli.
3Apa hubungan antara standar deviasi dan varians?
Apa hubungan antara standar deviasi dan varians?
Jawaban
Standar deviasi adalah akar kuadrat dari varians. Transformasi ini mengembalikan ukuran dispersi ke satuan data asli, sehingga lebih mudah diinterpretasikan. Misalnya, jika data dalam euro, varians akan dalam euro kuadrat (sulit ditafsirkan), sedangkan standar deviasi akan dalam euro. Oleh karena itu, standar deviasi lebih disukai untuk mengkomunikasikan dispersi data secara intuitif.
Apa yang direpresentasikan oleh kuartil pertama (Q1) dari sebuah distribusi?
Bagaimana menafsirkan koefisien korelasi Pearson sebesar -0.85?
+17 pertanyaan wawancara
Topik wawancara Data Science & ML lainnya
Dasar-dasar Python
Pemrograman Berorientasi Objek Python
Struktur Data Python
Dasar-Dasar Git
Dasar-dasar SQL
Dasar-Dasar NumPy
Dasar-dasar Pandas
Jupyter & Google Colab
SQL Joins & Kueri Lanjutan
Pandas Lanjutan
Visualisasi dengan Matplotlib & Seaborn
Visualisasi Interaktif dengan Plotly
Statistik Inferensial
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML Terbimbing: Regresi
ML Terbimbing: Klasifikasi
Pohon Keputusan & Ensemble
ML Tanpa Pengawasan
Pipeline ML & Validasi
Deret Waktu & Peramalan
Dasar-Dasar Deep Learning
TensorFlow & Keras
CNN dan klasifikasi gambar
RNN & Sekuens
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps dan Deployment
Kuasai Data Science & ML untuk wawancara berikutnya
Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.
Mulai gratis