Data Engineering

Data Modeling dla Data Engineering

Star schema, snowflake, Data Vault, normalizacja, typy SCD, grain, metryki addytywne

20 pytań z rozmów·
Mid-Level
1

Czym jest star schema?

Odpowiedź

Star schema to wymiarowy model danych, w którym centralna fact table jest otoczona przez dimension tables. Fact table zawiera metryki i foreign keys do wymiarów, które przechowują atrybuty opisowe. Ta prosta, zdenormalizowana struktura optymalizuje wydajność zapytań analitycznych poprzez minimalizację złączeń.

2

Jaka jest różnica między fact table a dimension table?

Odpowiedź

Fact table zawiera ilościowe miary (metryki) i foreign keys do wymiarów. Rejestruje zdarzenia lub transakcje. Dimension table zawiera atrybuty opisowe (kto, co, gdzie, kiedy) umożliwiające filtrowanie i grupowanie faktów. Fakty są liczbowe i agregowalne, wymiary są tekstowe i opisowe.

3

Czym jest grain fact table?

Odpowiedź

Grain definiuje poziom szczegółowości wiersza w fact table. Odpowiada na pytanie: co dokładnie reprezentuje jeden wiersz? Na przykład, jedna sprzedaż na wiersz, jedna sprzedaż na dzień na produkt lub jedna sprzedaż na godzinę. Zdefiniowanie grain jest pierwszym krokiem modelowania wymiarowego, ponieważ określa, które wymiary są potrzebne i jaki poziom agregacji jest przechowywany.

4

Jaka jest różnica między star schema a snowflake schema?

5

Czym jest conformed dimension?

+17 pytań z rozmów

Opanuj Data Engineering na następną rozmowę

Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.

Zacznij za darmo