Data Science & ML

Tanımlayıcı İstatistik

Ortalama, medyan, standart sapma, çeyrekler, dağılımlar, korelasyonlar, aykırı değerler, çarpıklık

20 mülakat soruları·
Mid-Level
1

Aşırı değerler (aykırı değerler) içeren veriler için en uygun merkezi eğilim ölçüsü hangisidir?

Cevap

Medyan, sıralanmış verilerin orta değerini temsil ettiği ve aşırı değerlerden etkilenmediği için aykırı değerlere karşı en sağlam merkezi eğilim ölçüsüdür. Tüm değerleri toplayan ortalamanın aksine, medyan yalnızca konumu dikkate alır. Örneğin, birkaç yüksek maaşlı yöneticinin bulunduğu bir şirketin maaşları için medyan, ortalamadan daha iyi bir tipik maaş temsili sağlar.

2

Bir veri kümesinin varyansı nedir?

Cevap

Varyans, verilerin ortalamaları etrafındaki dağılımını ölçer. Ortalamadan sapmaların karelerinin ortalaması olarak hesaplanır. Kare alarak her zaman pozitif değerler elde ederiz ve ortalamadan uzak değerlerin etkisini artırırız. Varyansın birimi orijinal veri biriminin karesidir, bu nedenle dağılımı orijinal birimde yorumlamak için genellikle standart sapma (varyansın karekökü) kullanılır.

3

Standart sapma ve varyans arasındaki ilişki nedir?

Cevap

Standart sapma, varyansın kareköküdür. Bu dönüşüm, dağılım ölçüsünü orijinal veri birimine geri getirerek yorumlamayı kolaylaştırır. Örneğin, veriler euro cinsindense, varyans euro kare cinsinden (yorumlanması zor) olurken standart sapma euro cinsinden olur. Bu nedenle veri dağılımını sezgisel olarak iletmek için standart sapma tercih edilir.

4

Bir dağılımın birinci çeyreği (Q1) neyi temsil eder?

5

-0.85'lik bir Pearson korelasyon katsayısı nasıl yorumlanır?

+17 mülakat soruları

Bir sonraki mülakatın için Data Science & ML'de uzmanlaş

Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.

Ücretsiz başla