
Data Modeling สำหรับ Data Engineering
Star schema, snowflake, Data Vault, การ normalize, ประเภท SCD, grain, additive metrics
1Star schema คืออะไร?
Star schema คืออะไร?
คำตอบ
Star schema คือโมเดลข้อมูลแบบ dimensional ที่ fact table ตรงกลางถูกล้อมรอบด้วย dimension tables โดย fact table จะมี metrics และ foreign keys ไปยัง dimensions ซึ่งเก็บ attributes เชิงพรรณนา โครงสร้างที่เรียบง่ายและ denormalized นี้ช่วยเพิ่มประสิทธิภาพการ query เชิงวิเคราะห์โดยลดจำนวน joins
2ความแตกต่างระหว่าง fact table และ dimension table คืออะไร?
ความแตกต่างระหว่าง fact table และ dimension table คืออะไร?
คำตอบ
Fact table จะมีการวัดเชิงปริมาณ (metrics) และ foreign keys ไปยัง dimensions ใช้บันทึกเหตุการณ์หรือธุรกรรม Dimension table จะมี attributes เชิงพรรณนา (ใคร อะไร ที่ไหน เมื่อไร) ที่ช่วยให้กรองและจัดกลุ่ม facts ได้ Facts เป็นตัวเลขและรวมได้ ส่วน dimensions เป็นข้อความและเชิงพรรณนา
3Grain ของ fact table คืออะไร?
Grain ของ fact table คืออะไร?
คำตอบ
Grain กำหนดระดับรายละเอียดของหนึ่งแถวใน fact table โดยตอบคำถามว่า: หนึ่งแถวแทนสิ่งใดกันแน่? ตัวอย่างเช่น หนึ่งการขายต่อแถว, หนึ่งการขายต่อวันต่อสินค้า, หรือหนึ่งการขายต่อชั่วโมง การกำหนด grain คือขั้นตอนแรกของ dimensional modeling เพราะมันกำหนดว่า dimensions ใดบ้างที่จำเป็นและจัดเก็บที่ระดับการรวมใด
ความแตกต่างระหว่าง star schema และ snowflake schema คืออะไร?
Conformed dimension คืออะไร?
+17 คำถามสัมภาษณ์
หัวข้อสัมภาษณ์ Data Engineering อื่นๆ
Linux & Shell - พื้นฐาน
Git & GitHub - พื้นฐาน
Python ขั้นสูงสำหรับ Data Engineering
Docker - พื้นฐาน
Google Cloud Platform - พื้นฐาน
CI/CD และคุณภาพโค้ด
Docker Compose
FastAPI - Data API
SQL ขั้นสูงสำหรับ Data Engineering
Data Lake - สถาปัตยกรรมและการนำเข้าข้อมูล
BigQuery สำหรับ Data Engineering
PostgreSQL - การดูแลระบบ
Fivetran & Airbyte - การนำเข้าข้อมูล
dbt - พื้นฐาน
Apache Airflow - พื้นฐาน
Kubernetes - พื้นฐาน
dbt - ฟีเจอร์ขั้นสูง
รูปแบบ ETL / ELT / ETLT
Apache Airflow - ขั้นสูง
Airflow + dbt - การจัดการ Pipeline
PySpark - การประมวลผลขนาดใหญ่
Google Pub/Sub - การสตรีมข้อมูล
Apache Beam & Dataflow
Kubernetes - Production และ Scaling
Terraform - Infrastructure as Code
ฐานข้อมูล NoSQL
Data Architecture สมัยใหม่
การมอนิเตอร์และการสังเกตการณ์
IAM และความปลอดภัยของข้อมูล
เชี่ยวชาญ Data Engineering สำหรับการสัมภาษณ์ครั้งถัดไป
เข้าถึงคำถามทั้งหมด flashcards แบบทดสอบเทคนิค แบบฝึกหัด code review และตัวจำลองสัมภาษณ์
เริ่มใช้ฟรี