
dbt - Gelişmiş özellikler
Jinja makroları, özel testler, packages, hooks, snapshots (SCD), incremental models, dbt Cloud, CI/CD
1dbt'de Jinja makrolarının ana amacı nedir?
dbt'de Jinja makrolarının ana amacı nedir?
Cevap
Jinja makroları, birden çok dbt modelinde kod yeniden kullanımına olanak tanır. Parametre kabul eden ve dinamik olarak oluşturulmuş SQL kodu döndüren işlevler gibi çalışırlar. Bu, kod tekrarını önler ve proje genelinde karmaşık dönüşümlerin bakımını kolaylaştırır.
2Bir dosyada yeniden kullanılabilir bir dbt makrosu nasıl tanımlanır?
Bir dosyada yeniden kullanılabilir bir dbt makrosu nasıl tanımlanır?
Cevap
Bir dbt makrosu, macros klasöründeki bir .sql dosyasında Jinja macro/endmacro söz dizimi kullanılarak tanımlanır. Makro adı, macro anahtar sözcüğünün ardından belirtilir ve parametreler parantez içinde verilir. Bu makro daha sonra projedeki herhangi bir modelden çağrılabilir.
3dbt snapshots için 'timestamp' ve 'check' stratejileri arasındaki fark nedir?
dbt snapshots için 'timestamp' ve 'check' stratejileri arasındaki fark nedir?
Cevap
timestamp stratejisi, değişiklikleri tespit etmek için bir güncelleme tarihi sütununu (updated_at) karşılaştırır; yalnızca bir sütunu karşılaştırdığı için daha performanslıdır. check stratejisi, herhangi bir değişikliği tespit etmek için belirtilen sütunların (check_cols) değerlerini karşılaştırır; güvenilir bir timestamp sütunu olmadığında yararlıdır.
dbt bir snapshot oluştururken hangi sütunları otomatik olarak ekler?
dbt'de 'merge' stratejisi ile incremental model nasıl yapılandırılır?
+17 mülakat soruları
Diğer Data Engineering mülakat konuları
Linux & Shell - Temeller
Git & GitHub - Temeller
Data Engineering için ileri düzey Python
Docker - Temeller
Google Cloud Platform - Temeller
CI/CD ve Kod Kalitesi
Docker Compose
FastAPI - Veri API'leri
Data Engineering için İleri Seviye SQL
Data Lake - Mimari ve Veri Alımı
Data Engineering için BigQuery
PostgreSQL - Yönetim
Data Engineering için Data Modeling
Fivetran & Airbyte - Veri Alımı
dbt - Temeller
Apache Airflow - Temeller
Kubernetes - Temeller
ETL / ELT / ETLT Desenleri
Apache Airflow - İleri Seviye
Airflow + dbt - Pipeline Orkestrasyonu
PySpark - Büyük Ölçekli İşleme
Google Pub/Sub - Veri Streaming
Apache Beam & Dataflow
Kubernetes - Üretim ve Ölçeklendirme
Terraform - Infrastructure as Code
NoSQL Veritabanları
Modern Data Architecture
İzleme ve Gözlemlenebilirlik
IAM ve Veri Güvenliği
Bir sonraki mülakatın için Data Engineering'de uzmanlaş
Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.
Ücretsiz başla