
BigQuery - Geavanceerde functies
Partitionering, clustering, gematerialiseerde views, UDF's, geneste queries, STRUCT, ARRAY
1Wat is de primaire rol van partitionering in BigQuery?
Wat is de primaire rol van partitionering in BigQuery?
Antwoord
Partitionering verdeelt een tabel in segmenten op basis van een kolom (vaak een datum), wat de hoeveelheid gescande gegevens tijdens queries vermindert. Wanneer een query filtert op de partitiekolom, leest BigQuery alleen de relevante partities in plaats van de hele tabel te scannen. Dit verbetert de prestaties en vermindert de querykosten, die worden gefactureerd op basis van het volume gescande gegevens.
2Welke soorten partitionering zijn beschikbaar in BigQuery?
Welke soorten partitionering zijn beschikbaar in BigQuery?
Antwoord
BigQuery biedt drie soorten partitionering: per DATE-, TIMESTAMP- of DATETIME-kolom (meest voorkomend), per integer-bereik (INTEGER RANGE) en per ingestietijd (_PARTITIONTIME). Op datum gebaseerde partitionering wordt het meest gebruikt omdat de meeste analyses filteren op tijdsperioden. Integer-bereik partitionering is nuttig voor numerieke identifiers.
3Wat is een STRUCT in BigQuery?
Wat is een STRUCT in BigQuery?
Antwoord
Een STRUCT (of RECORD) is een gegevenstype dat meerdere benoemde velden van mogelijk verschillende typen groepeert in een enkele kolom. Een STRUCT kan bijvoorbeeld een naam (STRING), een leeftijd (INT64) en een e-mail (STRING) bevatten. STRUCTs maken het mogelijk om hiërarchische gegevens direct binnen een tabel te modelleren, waardoor kostbare joins worden vermeden. Velden worden benaderd met puntnotatie (struct_col.field).
Wat is een ARRAY in BigQuery?
Wat is het doel van de UNNEST-functie in BigQuery?
+17 gespreksvragen
Andere Data Analytics-sollicitatieonderwerpen
Google Sheets - Grondbeginselen
Google Sheets - Geavanceerde formules
SQL - Grondbeginselen
SQL - Aggregaties en groeperingen
SQL - Joins
BigQuery - Grondbeginselen
Data Cleaning - Data opschonen
KPI's en business-metrieken
Beschrijvende statistiek
Zapier en No-Code automatisering
Principes van datavisualisatie
Python & Pandas - Grondbeginselen
Google Sheets - Geautomatiseerde dashboards
SQL - Subquery's en CTE's
SQL - Window Functions
Data Modeling
Funnel- en conversieanalyse
Cohort- en retentieanalyse
Google Tag Manager en tracking
API's en webhooks
dbt - Grondbeginselen
AB Testing en toegepaste statistiek
Looker Studio (Google Data Studio)
Power BI - Basisprincipes
SQL - Geavanceerde analytische queries
dbt - Geavanceerde functies
Power BI - DAX en geavanceerde dashboards
Python Analytics - Geavanceerde analyse en ML
Beheers Data Analytics voor je volgende gesprek
Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.
Begin gratis