Data Analytics

BigQuery - Funkcje zaawansowane

Partycjonowanie, klastrowanie, widoki zmaterializowane, UDF, zapytania zagnieżdżone, STRUCT, ARRAY

20 pytań z rozmów·
Mid-Level
1

Jaka jest główna rola partycjonowania w BigQuery?

Odpowiedź

Partycjonowanie dzieli tabelę na segmenty na podstawie kolumny (często daty), co zmniejsza ilość danych skanowanych podczas zapytań. Gdy zapytanie filtruje według kolumny partycji, BigQuery odczytuje tylko odpowiednie partycje, zamiast skanować całą tabelę. Poprawia to wydajność i obniża koszty zapytań, które są naliczane na podstawie wolumenu skanowanych danych.

2

Jakie typy partycjonowania są dostępne w BigQuery?

Odpowiedź

BigQuery oferuje trzy typy partycjonowania: według kolumny DATE, TIMESTAMP lub DATETIME (najczęstsze), według zakresu liczb całkowitych (INTEGER RANGE) i według czasu ingestii (_PARTITIONTIME). Partycjonowanie według daty jest najczęściej stosowane, ponieważ większość analiz filtruje według okresów czasu. Partycjonowanie według zakresu liczb całkowitych jest przydatne dla identyfikatorów liczbowych.

3

Czym jest STRUCT w BigQuery?

Odpowiedź

STRUCT (lub RECORD) to typ danych grupujący wiele nazwanych pól potencjalnie różnych typów w jednej kolumnie. Na przykład STRUCT może zawierać nazwę (STRING), wiek (INT64) i email (STRING). STRUCT umożliwia modelowanie danych hierarchicznych bezpośrednio w tabeli, unikając kosztownych łączeń. Do pól uzyskuje się dostęp za pomocą notacji kropkowej (struct_col.field).

4

Czym jest ARRAY w BigQuery?

5

Do czego służy funkcja UNNEST w BigQuery?

+17 pytań z rozmów

Opanuj Data Analytics na następną rozmowę

Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.

Zacznij za darmo