Data Engineering

Data Modeling para Data Engineering

Star schema, snowflake, Data Vault, normalização, tipos de SCD, grain, métricas aditivas

20 perguntas de entrevista·
Mid-Level
1

O que é um star schema?

Resposta

Um star schema é um modelo de dados dimensional onde uma fact table central é cercada por dimension tables. A fact table contém as métricas e as foreign keys para as dimensões, que contêm os atributos descritivos. Essa estrutura simples e desnormalizada otimiza o desempenho das queries analíticas minimizando os joins.

2

Qual é a diferença entre uma fact table e uma dimension table?

Resposta

Uma fact table contém as medidas quantitativas (métricas) e as foreign keys para as dimensões. Ela registra eventos ou transações. Uma dimension table contém os atributos descritivos (quem, o quê, onde, quando) que permitem filtrar e agrupar os fatos. Os fatos são numéricos e agregáveis, as dimensões são textuais e descritivas.

3

O que é o grain de uma fact table?

Resposta

O grain define o nível de detalhe de uma linha na fact table. Ele responde à pergunta: o que exatamente uma linha representa? Por exemplo, uma venda por linha, uma venda por dia por produto, ou uma venda por hora. Definir o grain é o primeiro passo do dimensional modeling pois determina quais dimensões são necessárias e qual nível de agregação é armazenado.

4

Qual é a diferença entre um star schema e um snowflake schema?

5

O que é uma conformed dimension?

+17 perguntas de entrevista

Domine Data Engineering para sua proxima entrevista

Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.

Comece gratis