Question 1

Was ist ein Star Schema im Data Modeling?

Accepted Answer

Das Star Schema ist eine dimensionale Modellierungsarchitektur, bei der eine zentrale Fact Table von direkt verbundenen Dimension Tables umgeben ist. Diese Struktur vereinfacht analytische Abfragen und optimiert die Leistung, indem sie mehrere Joins zwischen Dimensionen vermeidet. Der Name stammt von der visuellen Form des Diagramms, bei dem die zentrale Fact Table dem Körper eines Sterns und die Dimensionen den Zweigen ähneln.

Question 2

Welche Rolle spielt eine Fact Table in einem dimensionalen Modell?

Accepted Answer

Die Fact Table speichert quantitative Kennzahlen (Umsatz, verkaufte Menge, Anzahl der Klicks) und Fremdschlüssel zu Dimension Tables. Sie repräsentiert Geschäftsereignisse oder Transaktionen. Jede Zeile entspricht einem messbaren Ereignis auf einer definierten Granularitätsebene. Die numerischen Spalten (Measures) sind die Daten, die Analysten in ihren Abfragen aggregieren.

Question 3

Was ist eine Dimension Table in einem dimensionalen Modell?

Accepted Answer

Eine Dimension Table enthält beschreibende Attribute, die die Kennzahlen in der Fact Table qualifizieren. Zum Beispiel enthält eine Produkt-Dimension den Namen, die Kategorie, die Marke und den Stückpreis. Dimensionen ermöglichen das Filtern, Gruppieren und Aufteilen von Daten während der Analyse. Sie werden typischerweise denormalisiert, um Abfragen zu vereinfachen und zusätzliche Joins zu vermeiden.

Data Modeling

Was ist ein Star Schema im Data Modeling?

Antwort

Welche Rolle spielt eine Fact Table in einem dimensionalen Modell?

Antwort

Was ist eine Dimension Table in einem dimensionalen Modell?

Antwort

Was ist die Granularität (Grain) einer Fact Table?

Was ist der Unterschied zwischen einer additiven und einer semi-additiven Kennzahl?

Weitere Data Analytics-Interviewthemen

Google Sheets - Grundlagen

Google Sheets - Erweiterte Formeln

SQL - Grundlagen

SQL - Aggregationen und Gruppierungen

SQL - Joins

BigQuery - Grundlagen

Data Cleaning - Datenbereinigung

KPIs und Business-Metriken

Deskriptive Statistik

Zapier und No-Code-Automatisierung

Grundlagen der Datenvisualisierung

Python & Pandas - Grundlagen

Google Sheets - Automatisierte Dashboards

SQL - Unterabfragen und CTEs

SQL - Window Functions

BigQuery - Erweiterte Funktionen

Funnel- und Conversion-Analyse

Kohorten- und Retention-Analyse

Google Tag Manager und Tracking

APIs und Webhooks

dbt - Grundlagen

AB-Testing und angewandte Statistik

Looker Studio (Google Data Studio)

Power BI - Grundlagen

SQL - Erweiterte analytische Abfragen

dbt - Erweiterte Funktionen

Power BI - DAX und fortgeschrittene Dashboards

Python Analytics - Erweiterte Analyse und ML

Meistere Data Analytics für dein nächstes Interview