Data Engineering

dbt - Dasar

Proyek dbt, models, sources, refs, tests, dokumentasi, materializations (table, view, incremental), seeds

20 pertanyaan wawancaraยท
Mid-Level
1

Apa itu dbt (data build tool)?

Jawaban

dbt adalah alat transformasi data yang memungkinkan menulis transformasi dalam SQL dan menjalankannya di data warehouse. Ini menerapkan prinsip software engineering (versioning, tests, dokumentasi) pada pekerjaan transformasi data. dbt tidak menangani ekstraksi atau loading (E dan L dari ELT), hanya transformasi.

2

Apa struktur dasar dari proyek dbt?

Jawaban

Proyek dbt berisi file dbt_project.yml di root yang mendefinisikan konfigurasi proyek. Folder utamanya adalah models (berisi file SQL), tests untuk tests kustom, macros untuk macro Jinja, seeds untuk file CSV, dan snapshots untuk capture data historis. File profiles.yml (biasanya di luar proyek) mendefinisikan koneksi ke warehouse.

3

Apa peran file profiles.yml di dbt?

Jawaban

File profiles.yml berisi informasi koneksi ke data warehouse (BigQuery, Snowflake, Redshift, PostgreSQL, dll.). Biasanya disimpan di folder ~/.dbt/ dan bukan di proyek untuk menghindari versioning credentials sensitif. Setiap profil dapat memiliki beberapa target (dev, prod) yang memungkinkan peralihan mudah antara environment.

4

Apa itu model di dbt?

5

Apa peran fungsi ref() di dbt?

+17 pertanyaan wawancara

Kuasai Data Engineering untuk wawancara berikutnya

Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.

Mulai gratis