
Data Cleaning - Veri temizleme
Eksik değerler, yinelemeler, aykırı değerler, iş kuralları, dönüşüm, veri kalitesi
1Bir veri kümesinde eksik değer (missing value) nedir?
Bir veri kümesinde eksik değer (missing value) nedir?
Cevap
Eksik değer, bir alanda bulunmayan veya doldurulmamış veriyi temsil eder. Boş bir hücre, veritabanında NULL veya DataFrame'de NaN olarak görünebilir. Eksik değerleri tanımlamak, istatistiksel analizleri ve toplama işlemlerini bozabileceği için veri temizlemenin ilk adımıdır.
2Bir veritabanında NULL değeri ile boş bir dize arasındaki fark nedir?
Bir veritabanında NULL değeri ile boş bir dize arasındaki fark nedir?
Cevap
NULL, değerin bilinmediği veya var olmadığı anlamına gelirken, boş bir dize boş olan bilinen bir değerdir. Bu ayrım SQL'de temeldir çünkü NULL = operatörü ile karşılaştırılamaz (IS NULL kullanılmalıdır), boş bir dize ise = '' ile normal şekilde karşılaştırılabilir.
3Bir veri kümesinde yineleme (duplicate) nedir?
Bir veri kümesinde yineleme (duplicate) nedir?
Cevap
Yineleme, bir veri kümesinde birden fazla kez görünen bir kayıttır; ya tamamen (tüm sütunlar aynı) ya da kısmen (belirli anahtar sütunlar aynı) olabilir. Yinelemeler sayıları, toplamları ve ortalamaları bozar. Tespitleri genellikle benzersiz olması gereken anahtar sütunların belirlenmesine dayanır.
SQL'de tam yinelemeleri tespit etmeye olanak tanıyan teknik nedir?
Bir veri kümesinde aykırı değer (outlier) nedir?
+17 mülakat soruları
Diğer Data Analytics mülakat konuları
Google Sheets - Temeller
Google Sheets - Gelişmiş Formüller
SQL - Temeller
SQL - Toplama ve Gruplama
SQL - Join İşlemleri
BigQuery - Temeller
KPI'lar ve İş Metrikleri
Tanımlayıcı İstatistik
Zapier ve No-Code otomasyonu
Veri Görselleştirme İlkeleri
Python & Pandas - Temeller
Google Sheets - Otomatik Panolar
SQL - Alt Sorgular ve CTE'ler
SQL - Window Functions
BigQuery - Gelişmiş Özellikler
Data Modeling
Funnel ve Dönüşüm Analizi
Cohort ve Retention Analizi
Google Tag Manager ve Tracking
API'ler ve Webhook'lar
dbt - Temeller
AB Testing ve Uygulamalı İstatistik
Looker Studio (Google Data Studio)
Power BI - Temeller
SQL - Gelişmiş Analitik Sorgular
dbt - Gelişmiş Özellikler
Power BI - DAX ve Gelişmiş Dashboard'lar
Python Analytics - Gelişmiş Analiz ve ML
Bir sonraki mülakatın için Data Analytics'de uzmanlaş
Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.
Ücretsiz başla