Data Analytics

BigQuery - Recursos avançados

Particionamento, clustering, visões materializadas, UDFs, consultas aninhadas, STRUCT, ARRAY

20 perguntas de entrevista·
Mid-Level
1

Qual é o papel principal do particionamento no BigQuery?

Resposta

O particionamento divide uma tabela em segmentos baseados em uma coluna (geralmente uma data), o que reduz a quantidade de dados escaneados durante as consultas. Quando uma consulta filtra pela coluna de partição, o BigQuery lê apenas as partições relevantes em vez de escanear a tabela inteira. Isso melhora o desempenho e reduz os custos de consulta, que são cobrados com base no volume de dados escaneados.

2

Quais tipos de particionamento estão disponíveis no BigQuery?

Resposta

O BigQuery oferece três tipos de particionamento: por coluna DATE, TIMESTAMP ou DATETIME (o mais comum), por intervalo de inteiros (INTEGER RANGE) e por tempo de ingestão (_PARTITIONTIME). O particionamento por data é o mais utilizado porque a maioria das análises filtra por períodos de tempo. O particionamento por intervalo de inteiros é útil para identificadores numéricos.

3

O que é um STRUCT no BigQuery?

Resposta

Um STRUCT (ou RECORD) é um tipo de dados que agrupa múltiplos campos nomeados de tipos potencialmente diferentes em uma única coluna. Por exemplo, um STRUCT pode conter um nome (STRING), uma idade (INT64) e um email (STRING). STRUCTs permitem modelar dados hierárquicos diretamente em uma tabela, evitando joins custosos. Os campos são acessados usando notação de ponto (struct_col.field).

4

O que é um ARRAY no BigQuery?

5

Para que serve a função UNNEST no BigQuery?

+17 perguntas de entrevista

Domine Data Analytics para sua proxima entrevista

Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.

Comece gratis