Data Analytics

BigQuery - Fitur Lanjutan

Partitioning, clustering, materialized views, UDFs, kueri bersarang, STRUCT, ARRAY

20 pertanyaan wawancaraยท
Mid-Level
1

Apa peran utama partitioning di BigQuery?

Jawaban

Partitioning membagi tabel menjadi segmen berdasarkan kolom (sering kali tanggal), yang mengurangi jumlah data yang dipindai selama kueri. Ketika kueri memfilter pada kolom partisi, BigQuery hanya membaca partisi yang relevan alih-alih memindai seluruh tabel. Ini meningkatkan performa dan mengurangi biaya kueri, yang ditagih berdasarkan volume data yang dipindai.

2

Apa saja tipe partitioning yang tersedia di BigQuery?

Jawaban

BigQuery menawarkan tiga tipe partitioning: berdasarkan kolom DATE, TIMESTAMP, atau DATETIME (paling umum), berdasarkan rentang integer (INTEGER RANGE), dan berdasarkan waktu ingesti (_PARTITIONTIME). Partitioning berbasis tanggal adalah yang paling banyak digunakan karena sebagian besar analisis memfilter berdasarkan periode waktu. Partitioning rentang integer berguna untuk pengidentifikasi numerik.

3

Apa itu STRUCT di BigQuery?

Jawaban

STRUCT (atau RECORD) adalah tipe data yang mengelompokkan beberapa field bernama dengan tipe yang berpotensi berbeda dalam satu kolom. Misalnya, STRUCT dapat berisi nama (STRING), usia (INT64), dan email (STRING). STRUCT memungkinkan pemodelan data hierarkis langsung dalam tabel, menghindari join yang mahal. Field diakses menggunakan notasi titik (struct_col.field).

4

Apa itu ARRAY di BigQuery?

5

Apa tujuan fungsi UNNEST di BigQuery?

+17 pertanyaan wawancara

Kuasai Data Analytics untuk wawancara berikutnya

Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.

Mulai gratis