Data Science & ML

Statistik Deskriptif

Mean, median, standar deviasi, kuartil, distribusi, korelasi, outlier, skewness

20 pertanyaan wawancaraยท
Mid-Level
1

Ukuran tendensi sentral mana yang paling tepat untuk data yang mengandung nilai ekstrem (outlier)?

Jawaban

Median adalah ukuran tendensi sentral yang paling robust terhadap outlier karena merepresentasikan nilai tengah dari data yang telah diurutkan, tanpa terpengaruh oleh nilai ekstrem. Tidak seperti mean yang menjumlahkan semua nilai, median hanya mempertimbangkan posisi. Misalnya, untuk gaji perusahaan dengan beberapa eksekutif bergaji tinggi, median memberikan representasi gaji tipikal yang lebih baik daripada mean.

2

Apa itu varians dari sebuah dataset?

Jawaban

Varians mengukur dispersi data di sekitar mean-nya. Dihitung sebagai rata-rata dari kuadrat penyimpangan dari mean. Dengan mengkuadratkan, kita mendapatkan nilai yang selalu positif dan memperkuat dampak nilai yang jauh dari mean. Satuan varians adalah kuadrat dari satuan data asli, itulah mengapa kita sering menggunakan standar deviasi (akar kuadrat dari varians) untuk menafsirkan dispersi dalam satuan asli.

3

Apa hubungan antara standar deviasi dan varians?

Jawaban

Standar deviasi adalah akar kuadrat dari varians. Transformasi ini mengembalikan ukuran dispersi ke satuan data asli, sehingga lebih mudah diinterpretasikan. Misalnya, jika data dalam euro, varians akan dalam euro kuadrat (sulit ditafsirkan), sedangkan standar deviasi akan dalam euro. Oleh karena itu, standar deviasi lebih disukai untuk mengkomunikasikan dispersi data secara intuitif.

4

Apa yang direpresentasikan oleh kuartil pertama (Q1) dari sebuah distribusi?

5

Bagaimana menafsirkan koefisien korelasi Pearson sebesar -0.85?

+17 pertanyaan wawancara

Kuasai Data Science & ML untuk wawancara berikutnya

Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.

Mulai gratis