Data Engineering

Data Engineering을 위한 Data Modeling

Star schema, snowflake, Data Vault, 정규화, SCD 유형, grain, 가산 메트릭

20 면접 질문·
Mid-Level
1

star schema란 무엇입니까?

답변

star schema는 중앙의 fact table이 dimension table로 둘러싸인 차원 데이터 모델입니다. fact table에는 메트릭과 dimension에 대한 foreign key가 포함되며, dimension에는 설명 속성이 포함됩니다. 이 간단하고 비정규화된 구조는 join을 최소화하여 분석 쿼리 성능을 최적화합니다.

2

fact table과 dimension table의 차이점은 무엇입니까?

답변

fact table에는 정량적 측정값(메트릭)과 dimension에 대한 foreign key가 포함됩니다. 이벤트나 트랜잭션을 기록합니다. dimension table에는 fact를 필터링하고 그룹화할 수 있는 설명 속성(누가, 무엇을, 어디서, 언제)이 포함됩니다. fact는 숫자이며 집계 가능하고, dimension은 텍스트이며 설명적입니다.

3

fact table의 grain이란 무엇입니까?

답변

grain은 fact table에서 한 행의 세부 수준을 정의합니다. 한 행이 정확히 무엇을 나타내는가라는 질문에 답합니다. 예를 들어, 행당 한 건의 판매, 일자별 제품당 한 건의 판매, 시간당 한 건의 판매입니다. grain을 정의하는 것은 차원 모델링의 첫 번째 단계로, 어떤 dimension이 필요하고 어떤 수준의 집계가 저장되는지 결정합니다.

4

star schema와 snowflake schema의 차이점은 무엇입니까?

5

conformed dimension이란 무엇입니까?

+17 면접 질문

다음 면접을 위해 Data Engineering을 마스터하세요

모든 질문, flashcards, 기술 테스트, 코드 리뷰 연습, 면접 시뮬레이터에 접근하세요.

무료로 시작하기