Data Analytics

Data Modeling

Star schema, ตาราง fact และ dimension, การ normalize, การ denormalize, SCD, grain

20 คำถามสัมภาษณ์·
Mid-Level
1

Star schema ใน data modeling คืออะไร?

คำตอบ

Star schema คือสถาปัตยกรรมการสร้างแบบจำลองเชิงมิติที่ fact table กลางถูกล้อมรอบด้วย dimension table ที่เชื่อมต่อโดยตรง โครงสร้างนี้ทำให้คิวรีเชิงวิเคราะห์ง่ายขึ้นและเพิ่มประสิทธิภาพโดยหลีกเลี่ยง join หลายตัวระหว่าง dimension ชื่อนี้มาจากรูปร่างของแผนภาพ โดย fact table กลางมีลักษณะเหมือนตัวดาว และ dimension เป็นกิ่งก้าน

2

บทบาทของ fact table ในโมเดลเชิงมิติคืออะไร?

คำตอบ

Fact table จัดเก็บการวัดเชิงปริมาณ (รายได้ จำนวนที่ขาย จำนวนคลิก) และ foreign key ไปยัง dimension table มันแทนเหตุการณ์หรือธุรกรรมทางธุรกิจ แต่ละแถวสอดคล้องกับเหตุการณ์ที่วัดได้ในระดับ grain ที่กำหนด คอลัมน์ตัวเลข (measure) คือข้อมูลที่นักวิเคราะห์รวมในคิวรี

3

Dimension table ในโมเดลเชิงมิติคืออะไร?

คำตอบ

Dimension table ประกอบด้วยคุณสมบัติเชิงพรรณนาที่ขยายความการวัดใน fact table ตัวอย่างเช่น dimension สินค้าประกอบด้วยชื่อ หมวดหมู่ แบรนด์ และราคาต่อหน่วย Dimension ช่วยให้สามารถกรอง จัดกลุ่ม และตัดแบ่งข้อมูลในระหว่างการวิเคราะห์ โดยทั่วไปจะถูก denormalize เพื่อให้คิวรีง่ายขึ้นและหลีกเลี่ยง join เพิ่มเติม

4

Grain (granularity) ของ fact table คืออะไร?

5

ความแตกต่างระหว่างการวัดแบบ additive และ semi-additive คืออะไร?

+17 คำถามสัมภาษณ์

หัวข้อสัมภาษณ์ Data Analytics อื่นๆ

Google Sheets - พื้นฐาน

Junior
20 คำถาม

Google Sheets - สูตรขั้นสูง

Junior
20 คำถาม

SQL - พื้นฐาน

Junior
25 คำถาม

SQL - การรวมและการจัดกลุ่ม

Junior
20 คำถาม

SQL - Joins

Junior
20 คำถาม

BigQuery - พื้นฐาน

Junior
20 คำถาม

Data Cleaning - การทำความสะอาดข้อมูล

Junior
20 คำถาม

KPI และเมตริกทางธุรกิจ

Junior
20 คำถาม

สถิติเชิงพรรณนา

Junior
20 คำถาม

Zapier และระบบอัตโนมัติ No-Code

Junior
20 คำถาม

หลักการ Data Visualization

Junior
20 คำถาม

Python & Pandas - พื้นฐาน

Junior
20 คำถาม

Google Sheets - แดชบอร์ดอัตโนมัติ

Mid-Level
20 คำถาม

SQL - Subquery และ CTE

Mid-Level
20 คำถาม

SQL - Window Functions

Mid-Level
20 คำถาม

BigQuery - ฟีเจอร์ขั้นสูง

Mid-Level
20 คำถาม

การวิเคราะห์ Funnel และ Conversion

Mid-Level
20 คำถาม

การวิเคราะห์ Cohort และ Retention

Mid-Level
20 คำถาม

Google Tag Manager และการติดตาม

Mid-Level
20 คำถาม

API และ Webhook

Mid-Level
20 คำถาม

dbt - พื้นฐาน

Mid-Level
20 คำถาม

AB Testing และสถิติประยุกต์

Mid-Level
20 คำถาม

Looker Studio (Google Data Studio)

Mid-Level
20 คำถาม

Power BI - พื้นฐาน

Mid-Level
20 คำถาม

SQL - การคิวรีเชิงวิเคราะห์ขั้นสูง

Senior
20 คำถาม

dbt - ฟีเจอร์ขั้นสูง

Senior
20 คำถาม

Power BI - DAX และแดชบอร์ดขั้นสูง

Senior
20 คำถาม

Python Analytics - การวิเคราะห์ขั้นสูงและ ML

Senior
20 คำถาม

เชี่ยวชาญ Data Analytics สำหรับการสัมภาษณ์ครั้งถัดไป

เข้าถึงคำถามทั้งหมด flashcards แบบทดสอบเทคนิค แบบฝึกหัด code review และตัวจำลองสัมภาษณ์

เริ่มใช้ฟรี