
dbt - Temeller
dbt projesi, models, sources, refs, tests, dokümantasyon, materializations (table, view, incremental), seeds
1dbt (data build tool) nedir?
dbt (data build tool) nedir?
Cevap
dbt, dönüşümleri SQL ile yazmanıza ve data warehouse'da çalıştırmanıza olanak tanıyan bir veri dönüşüm aracıdır. Yazılım mühendisliği ilkelerini (versiyonlama, tests, dokümantasyon) veri dönüşüm çalışmasına uygular. dbt, çıkarma veya yükleme (ELT'nin E ve L'si) işlemini değil, yalnızca dönüşümü gerçekleştirir.
2Bir dbt projesinin temel yapısı nedir?
Bir dbt projesinin temel yapısı nedir?
Cevap
Bir dbt projesi, proje yapılandırmasını tanımlayan kök dizinde bir dbt_project.yml dosyası içerir. Ana klasörler models (SQL dosyalarını içerir), özel testler için tests, Jinja makroları için macros, CSV dosyaları için seeds ve geçmiş veri yakalamaları için snapshots'tır. profiles.yml dosyası (genellikle proje dışında) warehouse bağlantılarını tanımlar.
3dbt'de profiles.yml dosyasının rolü nedir?
dbt'de profiles.yml dosyasının rolü nedir?
Cevap
profiles.yml dosyası, data warehouse'lara (BigQuery, Snowflake, Redshift, PostgreSQL, vb.) bağlantı bilgilerini içerir. Hassas credentials'ı versiyonlamamak için genellikle proje içinde değil ~/.dbt/ klasöründe saklanır. Her profilin birden çok target'ı (dev, prod) olabilir, bu da ortamlar arasında kolayca geçiş yapılmasını sağlar.
dbt'de model nedir?
dbt'de ref() fonksiyonunun rolü nedir?
+17 mülakat soruları
Diğer Data Engineering mülakat konuları
Linux & Shell - Temeller
Git & GitHub - Temeller
Data Engineering için ileri düzey Python
Docker - Temeller
Google Cloud Platform - Temeller
CI/CD ve Kod Kalitesi
Docker Compose
FastAPI - Veri API'leri
Data Engineering için İleri Seviye SQL
Data Lake - Mimari ve Veri Alımı
Data Engineering için BigQuery
PostgreSQL - Yönetim
Data Engineering için Data Modeling
Fivetran & Airbyte - Veri Alımı
Apache Airflow - Temeller
Kubernetes - Temeller
dbt - Gelişmiş özellikler
ETL / ELT / ETLT Desenleri
Apache Airflow - İleri Seviye
Airflow + dbt - Pipeline Orkestrasyonu
PySpark - Büyük Ölçekli İşleme
Google Pub/Sub - Veri Streaming
Apache Beam & Dataflow
Kubernetes - Üretim ve Ölçeklendirme
Terraform - Infrastructure as Code
NoSQL Veritabanları
Modern Data Architecture
İzleme ve Gözlemlenebilirlik
IAM ve Veri Güvenliği
Bir sonraki mülakatın için Data Engineering'de uzmanlaş
Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.
Ücretsiz başla