Data Analytics

BigQuery - ฟีเจอร์ขั้นสูง

การแบ่งพาร์ติชัน, clustering, materialized views, UDFs, การคิวรีแบบซ้อน, STRUCT, ARRAY

20 คำถามสัมภาษณ์·
Mid-Level
1

บทบาทหลักของการแบ่งพาร์ติชัน (partitioning) ใน BigQuery คืออะไร?

คำตอบ

การแบ่งพาร์ติชันจะแบ่งตารางเป็นเซ็กเมนต์ตามคอลัมน์ (มักเป็นวันที่) ซึ่งช่วยลดปริมาณข้อมูลที่ถูกสแกนระหว่างการคิวรี เมื่อคิวรีกรองบนคอลัมน์พาร์ติชัน BigQuery จะอ่านเฉพาะพาร์ติชันที่เกี่ยวข้องแทนการสแกนทั้งตาราง สิ่งนี้ช่วยเพิ่มประสิทธิภาพและลดค่าใช้จ่ายในการคิวรี ซึ่งคิดตามปริมาณข้อมูลที่สแกน

2

ประเภทของการแบ่งพาร์ติชันที่มีใน BigQuery มีอะไรบ้าง?

คำตอบ

BigQuery มีการแบ่งพาร์ติชัน 3 ประเภท: ตามคอลัมน์ DATE, TIMESTAMP หรือ DATETIME (พบมากที่สุด), ตามช่วงจำนวนเต็ม (INTEGER RANGE) และตามเวลาที่นำเข้าข้อมูล (_PARTITIONTIME) การแบ่งพาร์ติชันตามวันที่ใช้งานมากที่สุดเพราะการวิเคราะห์ส่วนใหญ่กรองตามช่วงเวลา การแบ่งพาร์ติชันตามช่วงจำนวนเต็มมีประโยชน์สำหรับตัวระบุเชิงตัวเลข

3

STRUCT ใน BigQuery คืออะไร?

คำตอบ

STRUCT (หรือ RECORD) คือประเภทข้อมูลที่รวมหลายฟิลด์ที่มีชื่อซึ่งอาจมีประเภทต่างกันเข้าไว้ในคอลัมน์เดียว ตัวอย่างเช่น STRUCT สามารถมีชื่อ (STRING), อายุ (INT64) และอีเมล (STRING) STRUCT ช่วยให้สร้างแบบจำลองข้อมูลแบบลำดับชั้นได้โดยตรงภายในตาราง โดยหลีกเลี่ยงการ join ที่มีต้นทุนสูง เข้าถึงฟิลด์โดยใช้สัญกรณ์จุด (struct_col.field)

4

ARRAY ใน BigQuery คืออะไร?

5

ฟังก์ชัน UNNEST ใน BigQuery มีจุดประสงค์อะไร?

+17 คำถามสัมภาษณ์

หัวข้อสัมภาษณ์ Data Analytics อื่นๆ

Google Sheets - พื้นฐาน

Junior
20 คำถาม

Google Sheets - สูตรขั้นสูง

Junior
20 คำถาม

SQL - พื้นฐาน

Junior
25 คำถาม

SQL - การรวมและการจัดกลุ่ม

Junior
20 คำถาม

SQL - Joins

Junior
20 คำถาม

BigQuery - พื้นฐาน

Junior
20 คำถาม

Data Cleaning - การทำความสะอาดข้อมูล

Junior
20 คำถาม

KPI และเมตริกทางธุรกิจ

Junior
20 คำถาม

สถิติเชิงพรรณนา

Junior
20 คำถาม

Zapier และระบบอัตโนมัติ No-Code

Junior
20 คำถาม

หลักการ Data Visualization

Junior
20 คำถาม

Python & Pandas - พื้นฐาน

Junior
20 คำถาม

Google Sheets - แดชบอร์ดอัตโนมัติ

Mid-Level
20 คำถาม

SQL - Subquery และ CTE

Mid-Level
20 คำถาม

SQL - Window Functions

Mid-Level
20 คำถาม

Data Modeling

Mid-Level
20 คำถาม

การวิเคราะห์ Funnel และ Conversion

Mid-Level
20 คำถาม

การวิเคราะห์ Cohort และ Retention

Mid-Level
20 คำถาม

Google Tag Manager และการติดตาม

Mid-Level
20 คำถาม

API และ Webhook

Mid-Level
20 คำถาม

dbt - พื้นฐาน

Mid-Level
20 คำถาม

AB Testing และสถิติประยุกต์

Mid-Level
20 คำถาม

Looker Studio (Google Data Studio)

Mid-Level
20 คำถาม

Power BI - พื้นฐาน

Mid-Level
20 คำถาม

SQL - การคิวรีเชิงวิเคราะห์ขั้นสูง

Senior
20 คำถาม

dbt - ฟีเจอร์ขั้นสูง

Senior
20 คำถาม

Power BI - DAX และแดชบอร์ดขั้นสูง

Senior
20 คำถาม

Python Analytics - การวิเคราะห์ขั้นสูงและ ML

Senior
20 คำถาม

เชี่ยวชาญ Data Analytics สำหรับการสัมภาษณ์ครั้งถัดไป

เข้าถึงคำถามทั้งหมด flashcards แบบทดสอบเทคนิค แบบฝึกหัด code review และตัวจำลองสัมภาษณ์

เริ่มใช้ฟรี