
Data Modeling
Sterschema, fact- en dimensietabellen, normalisatie, denormalisatie, SCD, granulariteit
1Wat is een sterschema (star schema) in data modeling?
Wat is een sterschema (star schema) in data modeling?
Antwoord
Het sterschema is een dimensionele modelleringsarchitectuur waarbij een centrale fact table wordt omringd door direct verbonden dimension tables. Deze structuur vereenvoudigt analytische queries en optimaliseert de prestaties door meerdere joins tussen dimensies te vermijden. De naam komt van de visuele vorm van het diagram, waar de centrale fact table lijkt op het lichaam van een ster en de dimensies op de takken.
2Wat is de rol van een fact table in een dimensioneel model?
Wat is de rol van een fact table in een dimensioneel model?
Antwoord
De fact table slaat kwantitatieve maten op (omzet, verkochte hoeveelheid, aantal klikken) en foreign keys naar dimension tables. Het vertegenwoordigt bedrijfsgebeurtenissen of -transacties. Elke rij komt overeen met een meetbare gebeurtenis op een gedefinieerd granulariteitsniveau. De numerieke kolommen (measures) zijn de gegevens die analisten in hun queries aggregeren.
3Wat is een dimension table in een dimensioneel model?
Wat is een dimension table in een dimensioneel model?
Antwoord
Een dimension table bevat beschrijvende attributen die de maten in de fact table kwalificeren. Een Product-dimensie bevat bijvoorbeeld de naam, categorie, merk en eenheidsprijs. Dimensies maken het mogelijk om gegevens tijdens de analyse te filteren, groeperen en op te delen. Ze worden meestal gedenormaliseerd om queries te vereenvoudigen en extra joins te vermijden.
Wat is de grain (granulariteit) van een fact table?
Wat is het verschil tussen een additieve en een semi-additieve maat?
+17 gespreksvragen
Andere Data Analytics-sollicitatieonderwerpen
Google Sheets - Grondbeginselen
Google Sheets - Geavanceerde formules
SQL - Grondbeginselen
SQL - Aggregaties en groeperingen
SQL - Joins
BigQuery - Grondbeginselen
Data Cleaning - Data opschonen
KPI's en business-metrieken
Beschrijvende statistiek
Zapier en No-Code automatisering
Principes van datavisualisatie
Python & Pandas - Grondbeginselen
Google Sheets - Geautomatiseerde dashboards
SQL - Subquery's en CTE's
SQL - Window Functions
BigQuery - Geavanceerde functies
Funnel- en conversieanalyse
Cohort- en retentieanalyse
Google Tag Manager en tracking
API's en webhooks
dbt - Grondbeginselen
AB Testing en toegepaste statistiek
Looker Studio (Google Data Studio)
Power BI - Basisprincipes
SQL - Geavanceerde analytische queries
dbt - Geavanceerde functies
Power BI - DAX en geavanceerde dashboards
Python Analytics - Geavanceerde analyse en ML
Beheers Data Analytics voor je volgende gesprek
Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.
Begin gratis