
dbt - Fitur lanjutan
Macro Jinja, tes kustom, packages, hooks, snapshots (SCD), incremental models, dbt Cloud, CI/CD
1Dalam dbt, apa fungsi utama dari macro Jinja?
Dalam dbt, apa fungsi utama dari macro Jinja?
Jawaban
Macro Jinja memungkinkan penggunaan kembali kode di beberapa model dbt. Macro bekerja seperti fungsi yang menerima parameter dan mengembalikan kode SQL yang dihasilkan secara dinamis. Hal ini menghindari duplikasi kode dan memudahkan pemeliharaan transformasi kompleks di seluruh proyek.
2Bagaimana cara mendefinisikan macro dbt yang dapat digunakan kembali dalam sebuah file?
Bagaimana cara mendefinisikan macro dbt yang dapat digunakan kembali dalam sebuah file?
Jawaban
Macro dbt didefinisikan menggunakan sintaks Jinja macro/endmacro dalam file .sql di dalam folder macros. Nama macro ditentukan setelah kata kunci macro, diikuti oleh parameter dalam tanda kurung. Macro ini kemudian dapat dipanggil dari model mana pun dalam proyek.
3Apa perbedaan antara strategi 'timestamp' dan 'check' untuk snapshots dbt?
Apa perbedaan antara strategi 'timestamp' dan 'check' untuk snapshots dbt?
Jawaban
Strategi timestamp membandingkan kolom tanggal pembaruan (updated_at) untuk mendeteksi perubahan, yang lebih performant karena hanya membandingkan satu kolom. Strategi check membandingkan nilai kolom yang ditentukan (check_cols) untuk mendeteksi perubahan apa pun, berguna ketika tidak ada kolom timestamp yang dapat diandalkan.
Kolom apa yang secara otomatis ditambahkan oleh dbt saat membuat snapshot?
Bagaimana cara mengkonfigurasi model incremental dengan strategi 'merge' di dbt?
+17 pertanyaan wawancara
Topik wawancara Data Engineering lainnya
Linux & Shell - Dasar-dasar
Git & GitHub - Dasar-dasar
Python lanjutan untuk Data Engineering
Docker - Dasar-dasar
Google Cloud Platform - Dasar-Dasar
CI/CD dan Kualitas Kode
Docker Compose
FastAPI - API Data
SQL Lanjutan untuk Data Engineering
Data Lake - Arsitektur dan Ingesti
BigQuery untuk Data Engineering
PostgreSQL - Administrasi
Data Modeling untuk Data Engineering
Fivetran & Airbyte - Ingesti Data
dbt - Dasar
Apache Airflow - Dasar-Dasar
Kubernetes - Dasar-Dasar
Pola ETL / ELT / ETLT
Apache Airflow - Lanjutan
Airflow + dbt - Orkestrasi Pipeline
PySpark - Pemrosesan Skala Besar
Google Pub/Sub - Streaming Data
Apache Beam & Dataflow
Kubernetes - Produksi dan Penskalaan
Terraform - Infrastructure as Code
Database NoSQL
Data Architecture Modern
Monitoring dan Observability
IAM dan Keamanan Data
Kuasai Data Engineering untuk wawancara berikutnya
Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.
Mulai gratis