Data Analytics

BigQuery - Geavanceerde functies

Partitionering, clustering, gematerialiseerde views, UDF's, geneste queries, STRUCT, ARRAY

20 gespreksvragen·
Mid-Level
1

Wat is de primaire rol van partitionering in BigQuery?

Antwoord

Partitionering verdeelt een tabel in segmenten op basis van een kolom (vaak een datum), wat de hoeveelheid gescande gegevens tijdens queries vermindert. Wanneer een query filtert op de partitiekolom, leest BigQuery alleen de relevante partities in plaats van de hele tabel te scannen. Dit verbetert de prestaties en vermindert de querykosten, die worden gefactureerd op basis van het volume gescande gegevens.

2

Welke soorten partitionering zijn beschikbaar in BigQuery?

Antwoord

BigQuery biedt drie soorten partitionering: per DATE-, TIMESTAMP- of DATETIME-kolom (meest voorkomend), per integer-bereik (INTEGER RANGE) en per ingestietijd (_PARTITIONTIME). Op datum gebaseerde partitionering wordt het meest gebruikt omdat de meeste analyses filteren op tijdsperioden. Integer-bereik partitionering is nuttig voor numerieke identifiers.

3

Wat is een STRUCT in BigQuery?

Antwoord

Een STRUCT (of RECORD) is een gegevenstype dat meerdere benoemde velden van mogelijk verschillende typen groepeert in een enkele kolom. Een STRUCT kan bijvoorbeeld een naam (STRING), een leeftijd (INT64) en een e-mail (STRING) bevatten. STRUCTs maken het mogelijk om hiërarchische gegevens direct binnen een tabel te modelleren, waardoor kostbare joins worden vermeden. Velden worden benaderd met puntnotatie (struct_col.field).

4

Wat is een ARRAY in BigQuery?

5

Wat is het doel van de UNNEST-functie in BigQuery?

+17 gespreksvragen

Beheers Data Analytics voor je volgende gesprek

Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.

Begin gratis