Data Engineering

Data Modeling für Data Engineering

Star Schema, Snowflake, Data Vault, Normalisierung, SCD-Typen, Grain, additive Metriken

20 Interview-Fragen·
Mid-Level
1

Was ist ein Star Schema?

Antwort

Ein Star Schema ist ein dimensionales Datenmodell, bei dem eine zentrale Fact Table von Dimension Tables umgeben ist. Die Fact Table enthält Metriken und Foreign Keys zu den Dimensionen, die wiederum beschreibende Attribute enthalten. Diese einfache, denormalisierte Struktur optimiert die Performance analytischer Queries durch Minimierung der Joins.

2

Was ist der Unterschied zwischen einer Fact Table und einer Dimension Table?

Antwort

Eine Fact Table enthält quantitative Maße (Metriken) und Foreign Keys zu den Dimensionen. Sie zeichnet Ereignisse oder Transaktionen auf. Eine Dimension Table enthält beschreibende Attribute (wer, was, wo, wann), die das Filtern und Gruppieren von Facts ermöglichen. Facts sind numerisch und aggregierbar, Dimensionen sind textuell und beschreibend.

3

Was ist der Grain einer Fact Table?

Antwort

Der Grain definiert die Detailebene einer Zeile in der Fact Table. Er beantwortet die Frage: Was repräsentiert eine Zeile genau? Zum Beispiel ein Verkauf pro Zeile, ein Verkauf pro Tag und Produkt oder ein Verkauf pro Stunde. Die Definition des Grain ist der erste Schritt im Dimensional Modeling, da sie bestimmt, welche Dimensionen benötigt werden und welche Aggregationsebene gespeichert wird.

4

Was ist der Unterschied zwischen einem Star Schema und einem Snowflake Schema?

5

Was ist eine Conformed Dimension?

+17 Interview-Fragen

Meistere Data Engineering für dein nächstes Interview

Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.

Kostenlos starten