Data Analytics

dbt - พื้นฐาน

โปรเจกต์ dbt, models, sources, refs, tests, เอกสาร, materializations, seeds

20 คำถามสัมภาษณ์·
Mid-Level
1

dbt (data build tool) คืออะไร?

คำตอบ

dbt เป็นเครื่องมือแปลงข้อมูลที่อนุญาตให้นักวิเคราะห์และวิศวกรข้อมูลเขียนการแปลงข้อมูลด้วย SQL หรือ Python โดยตรงใน data warehouse โดยใช้แนวทาง ELT (Extract, Load, Transform) ซึ่งข้อมูลจะถูกโหลดเข้าสู่ warehouse ก่อนแล้วแปลงในตำแหน่งนั้น ต่างจาก ETL แบบดั้งเดิมที่แปลงก่อนการโหลด dbt จัดการการพึ่งพาระหว่างโมเดล การทดสอบ และเอกสารโดยอัตโนมัติ

2

โครงสร้างพื้นฐานของโปรเจกต์ dbt คืออะไร?

คำตอบ

โปรเจกต์ dbt ถูกจัดระเบียบรอบๆ โฟลเดอร์หลัก: models/ ประกอบด้วยไฟล์ SQL ที่กำหนดการแปลงข้อมูล seeds/ เก็บไฟล์ CSV ที่โหลดเป็นตาราง tests/ เก็บการทดสอบที่กำหนดเอง macros/ มีฟังก์ชัน Jinja ที่ใช้ซ้ำได้ และ snapshots/ เก็บการจับภาพสถานะ ไฟล์ dbt_project.yml ที่รูทกำหนดค่าโปรเจกต์ (ชื่อ เวอร์ชัน materializations เริ่มต้น) ในขณะที่ profiles.yml กำหนดการเชื่อมต่อ warehouse

3

model ใน dbt คืออะไร?

คำตอบ

dbt model คือไฟล์ SQL ที่มีคำสั่ง SELECT ซึ่งกำหนดการแปลงข้อมูล แต่ละ model สอดคล้องกับไฟล์ .sql ในโฟลเดอร์ models/ และสร้างตารางหรือ view ใน data warehouse เมื่อทำงาน Model สามารถอ้างอิง model อื่นผ่านฟังก์ชัน ref() สร้างกราฟการพึ่งพา (DAG) ที่ dbt ดำเนินการตามลำดับที่ถูกต้อง

4

ฟังก์ชัน ref() ใน dbt มีจุดประสงค์อะไร?

5

source ใน dbt คืออะไรและจะประกาศอย่างไร?

+17 คำถามสัมภาษณ์

หัวข้อสัมภาษณ์ Data Analytics อื่นๆ

Google Sheets - พื้นฐาน

Junior
20 คำถาม

Google Sheets - สูตรขั้นสูง

Junior
20 คำถาม

SQL - พื้นฐาน

Junior
25 คำถาม

SQL - การรวมและการจัดกลุ่ม

Junior
20 คำถาม

SQL - Joins

Junior
20 คำถาม

BigQuery - พื้นฐาน

Junior
20 คำถาม

Data Cleaning - การทำความสะอาดข้อมูล

Junior
20 คำถาม

KPI และเมตริกทางธุรกิจ

Junior
20 คำถาม

สถิติเชิงพรรณนา

Junior
20 คำถาม

Zapier และระบบอัตโนมัติ No-Code

Junior
20 คำถาม

หลักการ Data Visualization

Junior
20 คำถาม

Python & Pandas - พื้นฐาน

Junior
20 คำถาม

Google Sheets - แดชบอร์ดอัตโนมัติ

Mid-Level
20 คำถาม

SQL - Subquery และ CTE

Mid-Level
20 คำถาม

SQL - Window Functions

Mid-Level
20 คำถาม

BigQuery - ฟีเจอร์ขั้นสูง

Mid-Level
20 คำถาม

Data Modeling

Mid-Level
20 คำถาม

การวิเคราะห์ Funnel และ Conversion

Mid-Level
20 คำถาม

การวิเคราะห์ Cohort และ Retention

Mid-Level
20 คำถาม

Google Tag Manager และการติดตาม

Mid-Level
20 คำถาม

API และ Webhook

Mid-Level
20 คำถาม

AB Testing และสถิติประยุกต์

Mid-Level
20 คำถาม

Looker Studio (Google Data Studio)

Mid-Level
20 คำถาม

Power BI - พื้นฐาน

Mid-Level
20 คำถาม

SQL - การคิวรีเชิงวิเคราะห์ขั้นสูง

Senior
20 คำถาม

dbt - ฟีเจอร์ขั้นสูง

Senior
20 คำถาม

Power BI - DAX และแดชบอร์ดขั้นสูง

Senior
20 คำถาม

Python Analytics - การวิเคราะห์ขั้นสูงและ ML

Senior
20 คำถาม

เชี่ยวชาญ Data Analytics สำหรับการสัมภาษณ์ครั้งถัดไป

เข้าถึงคำถามทั้งหมด flashcards แบบทดสอบเทคนิค แบบฝึกหัด code review และตัวจำลองสัมภาษณ์

เริ่มใช้ฟรี