Data Analytics

BigQuery - Funzionalità avanzate

Partizionamento, clustering, viste materializzate, UDF, query nidificate, STRUCT, ARRAY

20 domande da colloquio·
Mid-Level
1

Qual è il ruolo principale del partizionamento in BigQuery?

Risposta

Il partizionamento divide una tabella in segmenti basati su una colonna (spesso una data), il che riduce la quantità di dati scansionati durante le query. Quando una query filtra sulla colonna di partizione, BigQuery legge solo le partizioni rilevanti invece di scansionare l'intera tabella. Questo migliora le prestazioni e riduce i costi delle query, che sono fatturati in base al volume di dati scansionati.

2

Quali tipi di partizionamento sono disponibili in BigQuery?

Risposta

BigQuery offre tre tipi di partizionamento: per colonna DATE, TIMESTAMP o DATETIME (il più comune), per intervallo di interi (INTEGER RANGE) e per tempo di ingestione (_PARTITIONTIME). Il partizionamento per data è il più utilizzato perché la maggior parte delle analisi filtra per periodi temporali. Il partizionamento per intervallo di interi è utile per identificatori numerici.

3

Cos'è uno STRUCT in BigQuery?

Risposta

Uno STRUCT (o RECORD) è un tipo di dato che raggruppa più campi denominati di tipi potenzialmente diversi in una singola colonna. Ad esempio, uno STRUCT può contenere un nome (STRING), un'età (INT64) e un'email (STRING). Gli STRUCT consentono di modellare dati gerarchici direttamente all'interno di una tabella, evitando join costosi. Si accede ai campi usando la notazione punto (struct_col.field).

4

Cos'è un ARRAY in BigQuery?

5

A cosa serve la funzione UNNEST in BigQuery?

+17 domande da colloquio

Padroneggia Data Analytics per il tuo prossimo colloquio

Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.

Inizia gratis