Data Analytics

BigQuery - Tính năng nâng cao

Phân vùng, clustering, view vật chất hóa, UDFs, truy vấn lồng nhau, STRUCT, ARRAY

20 câu hỏi phỏng vấn·
Mid-Level
1

Vai trò chính của phân vùng (partitioning) trong BigQuery là gì?

Câu trả lời

Phân vùng chia một bảng thành các phân đoạn dựa trên một cột (thường là ngày), giúp giảm lượng dữ liệu được quét trong các truy vấn. Khi truy vấn lọc trên cột phân vùng, BigQuery chỉ đọc các phân vùng có liên quan thay vì quét toàn bộ bảng. Điều này cải thiện hiệu suất và giảm chi phí truy vấn, vốn được tính dựa trên khối lượng dữ liệu được quét.

2

Các loại phân vùng nào có sẵn trong BigQuery?

Câu trả lời

BigQuery cung cấp ba loại phân vùng: theo cột DATE, TIMESTAMP hoặc DATETIME (phổ biến nhất), theo phạm vi số nguyên (INTEGER RANGE) và theo thời gian nạp dữ liệu (_PARTITIONTIME). Phân vùng theo ngày được sử dụng rộng rãi nhất vì hầu hết các phân tích đều lọc theo các khoảng thời gian. Phân vùng theo phạm vi số nguyên hữu ích cho các định danh số.

3

STRUCT trong BigQuery là gì?

Câu trả lời

STRUCT (hoặc RECORD) là kiểu dữ liệu nhóm nhiều trường được đặt tên với các kiểu có thể khác nhau vào một cột duy nhất. Ví dụ, một STRUCT có thể chứa tên (STRING), tuổi (INT64) và email (STRING). STRUCT cho phép mô hình hóa dữ liệu phân cấp trực tiếp trong một bảng, tránh các join tốn kém. Các trường được truy cập bằng ký hiệu chấm (struct_col.field).

4

ARRAY trong BigQuery là gì?

5

Mục đích của hàm UNNEST trong BigQuery là gì?

+17 câu hỏi phỏng vấn

Nắm vững Data Analytics cho lần phỏng vấn tiếp theo

Truy cập tất cả câu hỏi, flashcards, bài kiểm tra kỹ thuật, bài tập code review và mô phỏng phỏng vấn.

Bắt đầu miễn phí