
Data Engineering için Data Modeling
Star schema, snowflake, Data Vault, normalizasyon, SCD tipleri, grain, toplanabilir metrikler
1Star schema nedir?
Star schema nedir?
Cevap
Star schema, merkezi bir fact table'ın dimension table'lar ile çevrelendiği boyutsal bir veri modelidir. Fact table, metrikleri ve dimension'lara giden foreign key'leri içerir, dimension'lar ise tanımlayıcı öznitelikleri tutar. Bu basit, denormalize edilmiş yapı, join'leri en aza indirerek analitik sorgu performansını optimize eder.
2Fact table ile dimension table arasındaki fark nedir?
Fact table ile dimension table arasındaki fark nedir?
Cevap
Fact table, niceliksel ölçümleri (metrikler) ve dimension'lara giden foreign key'leri içerir. Olayları veya işlemleri kaydeder. Dimension table, fact'lerin filtrelenmesini ve gruplandırılmasını sağlayan tanımlayıcı öznitelikleri (kim, ne, nerede, ne zaman) içerir. Fact'ler sayısal ve toplanabilirken, dimension'lar metinsel ve tanımlayıcıdır.
3Bir fact table'ın grain'i nedir?
Bir fact table'ın grain'i nedir?
Cevap
Grain, fact table'daki bir satırın detay seviyesini tanımlar. Bir satırın tam olarak neyi temsil ettiği sorusuna cevap verir. Örneğin, satır başına bir satış, gün başına ürün başına bir satış veya saat başına bir satış. Grain'i tanımlamak boyutsal modellemenin ilk adımıdır çünkü hangi dimension'ların gerekli olduğunu ve hangi toplama seviyesinin saklanacağını belirler.
Star schema ile snowflake schema arasındaki fark nedir?
Conformed dimension nedir?
+17 mülakat soruları
Diğer Data Engineering mülakat konuları
Linux & Shell - Temeller
Git & GitHub - Temeller
Data Engineering için ileri düzey Python
Docker - Temeller
Google Cloud Platform - Temeller
CI/CD ve Kod Kalitesi
Docker Compose
FastAPI - Veri API'leri
Data Engineering için İleri Seviye SQL
Data Lake - Mimari ve Veri Alımı
Data Engineering için BigQuery
PostgreSQL - Yönetim
Fivetran & Airbyte - Veri Alımı
dbt - Temeller
Apache Airflow - Temeller
Kubernetes - Temeller
dbt - Gelişmiş özellikler
ETL / ELT / ETLT Desenleri
Apache Airflow - İleri Seviye
Airflow + dbt - Pipeline Orkestrasyonu
PySpark - Büyük Ölçekli İşleme
Google Pub/Sub - Veri Streaming
Apache Beam & Dataflow
Kubernetes - Üretim ve Ölçeklendirme
Terraform - Infrastructure as Code
NoSQL Veritabanları
Modern Data Architecture
İzleme ve Gözlemlenebilirlik
IAM ve Veri Güvenliği
Bir sonraki mülakatın için Data Engineering'de uzmanlaş
Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.
Ücretsiz başla