Data Analytics

dbt - Dasar-dasar

Proyek dbt, models, sources, refs, tests, dokumentasi, materializations, seeds

20 pertanyaan wawancara·
Mid-Level
1

Apa itu dbt (data build tool)?

Jawaban

dbt adalah alat transformasi data yang memungkinkan analis dan data engineer menulis transformasi dalam SQL atau Python langsung di data warehouse. Ini mengikuti pendekatan ELT (Extract, Load, Transform) di mana data terlebih dahulu dimuat ke warehouse kemudian ditransformasi di tempat, tidak seperti ETL tradisional yang mentransformasi sebelum memuat. dbt mengelola dependensi antar model, test, dan dokumentasi secara otomatis.

2

Apa struktur dasar proyek dbt?

Jawaban

Proyek dbt diorganisir di sekitar folder kunci: models/ berisi file SQL yang mendefinisikan transformasi, seeds/ menyimpan file CSV yang dimuat sebagai tabel, tests/ menyimpan test khusus, macros/ memiliki fungsi Jinja yang dapat digunakan kembali, dan snapshots/ menyimpan capture state. File dbt_project.yml di root mengonfigurasi proyek (nama, versi, materializations default), sementara profiles.yml mendefinisikan koneksi warehouse.

3

Apa itu model di dbt?

Jawaban

Sebuah dbt model adalah file SQL yang berisi pernyataan SELECT yang mendefinisikan transformasi data. Setiap model sesuai dengan file .sql di folder models/ dan menghasilkan tabel atau view di data warehouse saat dieksekusi. Model dapat mereferensikan model lain melalui fungsi ref(), menciptakan grafik dependensi (DAG) yang dieksekusi dbt dalam urutan yang benar.

4

Apa tujuan fungsi ref() di dbt?

5

Apa itu source di dbt dan bagaimana cara mendeklarasikannya?

+17 pertanyaan wawancara

Kuasai Data Analytics untuk wawancara berikutnya

Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.

Mulai gratis