
Data Modeling
Sternschema, Fakten- und Dimensionstabellen, Normalisierung, Denormalisierung, SCD, Granularität
1Was ist ein Star Schema im Data Modeling?
Was ist ein Star Schema im Data Modeling?
Antwort
Das Star Schema ist eine dimensionale Modellierungsarchitektur, bei der eine zentrale Fact Table von direkt verbundenen Dimension Tables umgeben ist. Diese Struktur vereinfacht analytische Abfragen und optimiert die Leistung, indem sie mehrere Joins zwischen Dimensionen vermeidet. Der Name stammt von der visuellen Form des Diagramms, bei dem die zentrale Fact Table dem Körper eines Sterns und die Dimensionen den Zweigen ähneln.
2Welche Rolle spielt eine Fact Table in einem dimensionalen Modell?
Welche Rolle spielt eine Fact Table in einem dimensionalen Modell?
Antwort
Die Fact Table speichert quantitative Kennzahlen (Umsatz, verkaufte Menge, Anzahl der Klicks) und Fremdschlüssel zu Dimension Tables. Sie repräsentiert Geschäftsereignisse oder Transaktionen. Jede Zeile entspricht einem messbaren Ereignis auf einer definierten Granularitätsebene. Die numerischen Spalten (Measures) sind die Daten, die Analysten in ihren Abfragen aggregieren.
3Was ist eine Dimension Table in einem dimensionalen Modell?
Was ist eine Dimension Table in einem dimensionalen Modell?
Antwort
Eine Dimension Table enthält beschreibende Attribute, die die Kennzahlen in der Fact Table qualifizieren. Zum Beispiel enthält eine Produkt-Dimension den Namen, die Kategorie, die Marke und den Stückpreis. Dimensionen ermöglichen das Filtern, Gruppieren und Aufteilen von Daten während der Analyse. Sie werden typischerweise denormalisiert, um Abfragen zu vereinfachen und zusätzliche Joins zu vermeiden.
Was ist die Granularität (Grain) einer Fact Table?
Was ist der Unterschied zwischen einer additiven und einer semi-additiven Kennzahl?
+17 Interview-Fragen
Weitere Data Analytics-Interviewthemen
Google Sheets - Grundlagen
Google Sheets - Erweiterte Formeln
SQL - Grundlagen
SQL - Aggregationen und Gruppierungen
SQL - Joins
BigQuery - Grundlagen
Data Cleaning - Datenbereinigung
KPIs und Business-Metriken
Deskriptive Statistik
Zapier und No-Code-Automatisierung
Grundlagen der Datenvisualisierung
Python & Pandas - Grundlagen
Google Sheets - Automatisierte Dashboards
SQL - Unterabfragen und CTEs
SQL - Window Functions
BigQuery - Erweiterte Funktionen
Funnel- und Conversion-Analyse
Kohorten- und Retention-Analyse
Google Tag Manager und Tracking
APIs und Webhooks
dbt - Grundlagen
AB-Testing und angewandte Statistik
Looker Studio (Google Data Studio)
Power BI - Grundlagen
SQL - Erweiterte analytische Abfragen
dbt - Erweiterte Funktionen
Power BI - DAX und fortgeschrittene Dashboards
Python Analytics - Erweiterte Analyse und ML
Meistere Data Analytics für dein nächstes Interview
Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.
Kostenlos starten