
BigQuery - Tính năng nâng cao
Phân vùng, clustering, view vật chất hóa, UDFs, truy vấn lồng nhau, STRUCT, ARRAY
1Vai trò chính của phân vùng (partitioning) trong BigQuery là gì?
Vai trò chính của phân vùng (partitioning) trong BigQuery là gì?
Câu trả lời
Phân vùng chia một bảng thành các phân đoạn dựa trên một cột (thường là ngày), giúp giảm lượng dữ liệu được quét trong các truy vấn. Khi truy vấn lọc trên cột phân vùng, BigQuery chỉ đọc các phân vùng có liên quan thay vì quét toàn bộ bảng. Điều này cải thiện hiệu suất và giảm chi phí truy vấn, vốn được tính dựa trên khối lượng dữ liệu được quét.
2Các loại phân vùng nào có sẵn trong BigQuery?
Các loại phân vùng nào có sẵn trong BigQuery?
Câu trả lời
BigQuery cung cấp ba loại phân vùng: theo cột DATE, TIMESTAMP hoặc DATETIME (phổ biến nhất), theo phạm vi số nguyên (INTEGER RANGE) và theo thời gian nạp dữ liệu (_PARTITIONTIME). Phân vùng theo ngày được sử dụng rộng rãi nhất vì hầu hết các phân tích đều lọc theo các khoảng thời gian. Phân vùng theo phạm vi số nguyên hữu ích cho các định danh số.
3STRUCT trong BigQuery là gì?
STRUCT trong BigQuery là gì?
Câu trả lời
STRUCT (hoặc RECORD) là kiểu dữ liệu nhóm nhiều trường được đặt tên với các kiểu có thể khác nhau vào một cột duy nhất. Ví dụ, một STRUCT có thể chứa tên (STRING), tuổi (INT64) và email (STRING). STRUCT cho phép mô hình hóa dữ liệu phân cấp trực tiếp trong một bảng, tránh các join tốn kém. Các trường được truy cập bằng ký hiệu chấm (struct_col.field).
ARRAY trong BigQuery là gì?
Mục đích của hàm UNNEST trong BigQuery là gì?
+17 câu hỏi phỏng vấn
Các chủ đề phỏng vấn Data Analytics khác
Google Sheets - Kiến thức cơ bản
Google Sheets - Công thức nâng cao
SQL - Cơ bản
SQL - Tổng hợp và nhóm
SQL - Joins
BigQuery - Kiến thức cơ bản
Data Cleaning - Làm sạch dữ liệu
KPI và chỉ số kinh doanh
Thống kê mô tả
Zapier và tự động hóa No-Code
Nguyên tắc trực quan hóa dữ liệu
Python & Pandas - Cơ bản
Google Sheets - Dashboard tự động
SQL - Truy vấn con và CTE
SQL - Window Functions
Data Modeling
Phân tích Funnel và Chuyển đổi
Phân tích Cohort và Retention
Google Tag Manager và Tracking
API và Webhook
dbt - Kiến thức cơ bản
AB Testing và Thống kê Ứng dụng
Looker Studio (Google Data Studio)
Power BI - Kiến Thức Cơ Bản
SQL - Truy Vấn Phân Tích Nâng Cao
dbt - Tính năng nâng cao
Power BI - DAX và Dashboard Nâng Cao
Python Analytics - Phân tích nâng cao và ML
Nắm vững Data Analytics cho lần phỏng vấn tiếp theo
Truy cập tất cả câu hỏi, flashcards, bài kiểm tra kỹ thuật, bài tập code review và mô phỏng phỏng vấn.
Bắt đầu miễn phí