
Data Modeling untuk Data Engineering
Star schema, snowflake, Data Vault, normalisasi, tipe SCD, grain, metrik aditif
1Apa itu star schema?
Apa itu star schema?
Jawaban
Star schema adalah model data dimensional di mana fact table pusat dikelilingi oleh dimension table. Fact table berisi metrik dan foreign key ke dimensi, yang berisi atribut deskriptif. Struktur sederhana dan terdenormalisasi ini mengoptimalkan kinerja query analitis dengan meminimalkan join.
2Apa perbedaan antara fact table dan dimension table?
Apa perbedaan antara fact table dan dimension table?
Jawaban
Fact table berisi ukuran kuantitatif (metrik) dan foreign key ke dimensi. Tabel ini mencatat peristiwa atau transaksi. Dimension table berisi atribut deskriptif (siapa, apa, di mana, kapan) yang memungkinkan pemfilteran dan pengelompokan fakta. Fakta bersifat numerik dan dapat diagregasi, dimensi bersifat tekstual dan deskriptif.
3Apa itu grain dari fact table?
Apa itu grain dari fact table?
Jawaban
Grain mendefinisikan tingkat detail dari satu baris dalam fact table. Ini menjawab pertanyaan: apa yang sebenarnya diwakili oleh satu baris? Misalnya, satu penjualan per baris, satu penjualan per hari per produk, atau satu penjualan per jam. Mendefinisikan grain adalah langkah pertama dalam dimensional modeling karena menentukan dimensi mana yang dibutuhkan dan tingkat agregasi mana yang disimpan.
Apa perbedaan antara star schema dan snowflake schema?
Apa itu conformed dimension?
+17 pertanyaan wawancara
Topik wawancara Data Engineering lainnya
Linux & Shell - Dasar-dasar
Git & GitHub - Dasar-dasar
Python lanjutan untuk Data Engineering
Docker - Dasar-dasar
Google Cloud Platform - Dasar-Dasar
CI/CD dan Kualitas Kode
Docker Compose
FastAPI - API Data
SQL Lanjutan untuk Data Engineering
Data Lake - Arsitektur dan Ingesti
BigQuery untuk Data Engineering
PostgreSQL - Administrasi
Fivetran & Airbyte - Ingesti Data
dbt - Dasar
Apache Airflow - Dasar-Dasar
Kubernetes - Dasar-Dasar
dbt - Fitur lanjutan
Pola ETL / ELT / ETLT
Apache Airflow - Lanjutan
Airflow + dbt - Orkestrasi Pipeline
PySpark - Pemrosesan Skala Besar
Google Pub/Sub - Streaming Data
Apache Beam & Dataflow
Kubernetes - Produksi dan Penskalaan
Terraform - Infrastructure as Code
Database NoSQL
Data Architecture Modern
Monitoring dan Observability
IAM dan Keamanan Data
Kuasai Data Engineering untuk wawancara berikutnya
Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.
Mulai gratis