Data Engineering

ETL / ELT / ETLT Desenleri

ETL vs ELT vs ETLT, batch vs micro-batch vs streaming, idempotans, hata yönetimi, dead letter queue, veri kalitesi, lineage

20 mülakat soruları·
Senior
1

ETL ve ELT arasındaki temel fark nedir?

Cevap

ETL'de (Extract-Transform-Load) veriler, hedefe yüklenmeden önce bir ara sunucuda dönüştürülür. ELT'de (Extract-Load-Transform) ham veriler önce hedefe (genellikle bir cloud data warehouse) yüklenir, ardından compute power'ı kullanılarak doğrudan içinde dönüştürülür. ELT, elastik compute power sunan BigQuery, Snowflake veya Redshift gibi cloud data warehouse'larla popülerleşmiştir.

2

Geleneksel ETL'e kıyasla ELT yaklaşımının temel avantajı nedir?

Cevap

ELT yaklaşımı, modern cloud data warehouse'ların (BigQuery, Snowflake, Redshift) elastik compute power'ından yararlanır. Bottleneck olabilecek ayrı bir dönüşüm altyapısını sürdürmek yerine, dönüşümler doğrudan data warehouse'un scaling yeteneklerini kullanır. Bu, operasyonel karmaşıklığı azaltır ve manuel kaynak provisioning olmadan çok daha büyük veri hacimlerini işlemeyi mümkün kılar.

3

ETLT deseni nedir ve ne zaman uygundur?

Cevap

ETLT, her iki yaklaşımı birleştirir: Çıkarma sırasında ilk hafif dönüşüm gerçekleştirilir (temizleme, filtreleme, anonimleştirme), ardından veriler yüklenir ve data warehouse'da daha karmaşık dönüşümler uygulanır. Bu desen, belirli dönüşümlerin compliance nedenleriyle (yükleme öncesi hassas veri maskeleme), hacim azaltma (erken filtreleme) veya heterojen kaynak formatlarını normalleştirme için yukarı akışta yapılması gerektiğinde kullanışlıdır.

4

Veri pipeline'ları bağlamında idempotans nedir?

5

Bir tabloya veri yüklerken idempotans nasıl uygulanır?

+17 mülakat soruları

Bir sonraki mülakatın için Data Engineering'de uzmanlaş

Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.

Ücretsiz başla