Data Analytics

Data Cleaning - Veri temizleme

Eksik değerler, yinelemeler, aykırı değerler, iş kuralları, dönüşüm, veri kalitesi

20 mülakat soruları·
Junior
1

Bir veri kümesinde eksik değer (missing value) nedir?

Cevap

Eksik değer, bir alanda bulunmayan veya doldurulmamış veriyi temsil eder. Boş bir hücre, veritabanında NULL veya DataFrame'de NaN olarak görünebilir. Eksik değerleri tanımlamak, istatistiksel analizleri ve toplama işlemlerini bozabileceği için veri temizlemenin ilk adımıdır.

2

Bir veritabanında NULL değeri ile boş bir dize arasındaki fark nedir?

Cevap

NULL, değerin bilinmediği veya var olmadığı anlamına gelirken, boş bir dize boş olan bilinen bir değerdir. Bu ayrım SQL'de temeldir çünkü NULL = operatörü ile karşılaştırılamaz (IS NULL kullanılmalıdır), boş bir dize ise = '' ile normal şekilde karşılaştırılabilir.

3

Bir veri kümesinde yineleme (duplicate) nedir?

Cevap

Yineleme, bir veri kümesinde birden fazla kez görünen bir kayıttır; ya tamamen (tüm sütunlar aynı) ya da kısmen (belirli anahtar sütunlar aynı) olabilir. Yinelemeler sayıları, toplamları ve ortalamaları bozar. Tespitleri genellikle benzersiz olması gereken anahtar sütunların belirlenmesine dayanır.

4

SQL'de tam yinelemeleri tespit etmeye olanak tanıyan teknik nedir?

5

Bir veri kümesinde aykırı değer (outlier) nedir?

+17 mülakat soruları

Bir sonraki mülakatın için Data Analytics'de uzmanlaş

Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.

Ücretsiz başla