
Data Engineering을 위한 Data Modeling
Star schema, snowflake, Data Vault, 정규화, SCD 유형, grain, 가산 메트릭
20 면접 질문·
Mid-Level
1star schema란 무엇입니까?
1
star schema란 무엇입니까?
답변
star schema는 중앙의 fact table이 dimension table로 둘러싸인 차원 데이터 모델입니다. fact table에는 메트릭과 dimension에 대한 foreign key가 포함되며, dimension에는 설명 속성이 포함됩니다. 이 간단하고 비정규화된 구조는 join을 최소화하여 분석 쿼리 성능을 최적화합니다.
2fact table과 dimension table의 차이점은 무엇입니까?
2
fact table과 dimension table의 차이점은 무엇입니까?
답변
fact table에는 정량적 측정값(메트릭)과 dimension에 대한 foreign key가 포함됩니다. 이벤트나 트랜잭션을 기록합니다. dimension table에는 fact를 필터링하고 그룹화할 수 있는 설명 속성(누가, 무엇을, 어디서, 언제)이 포함됩니다. fact는 숫자이며 집계 가능하고, dimension은 텍스트이며 설명적입니다.
3fact table의 grain이란 무엇입니까?
3
fact table의 grain이란 무엇입니까?
답변
grain은 fact table에서 한 행의 세부 수준을 정의합니다. 한 행이 정확히 무엇을 나타내는가라는 질문에 답합니다. 예를 들어, 행당 한 건의 판매, 일자별 제품당 한 건의 판매, 시간당 한 건의 판매입니다. grain을 정의하는 것은 차원 모델링의 첫 번째 단계로, 어떤 dimension이 필요하고 어떤 수준의 집계가 저장되는지 결정합니다.
4
star schema와 snowflake schema의 차이점은 무엇입니까?
5
conformed dimension이란 무엇입니까?
+17 면접 질문
기타 Data Engineering 면접 주제
Linux & Shell - 기초
Junior
20개 질문Git & GitHub - 기초
Junior
20개 질문데이터 엔지니어링을 위한 고급 Python
Junior
25개 질문Docker - 기초
Junior
25개 질문Google Cloud Platform - 기초
Junior
20개 질문CI/CD 및 코드 품질
Mid-Level
20개 질문Docker Compose
Mid-Level
20개 질문FastAPI - 데이터 API
Mid-Level
20개 질문Data Engineering을 위한 고급 SQL
Mid-Level
20개 질문Data Lake - 아키텍처 및 수집
Mid-Level
20개 질문데이터 엔지니어링을 위한 BigQuery
Mid-Level
20개 질문PostgreSQL - 관리
Mid-Level
20개 질문Fivetran & Airbyte - 데이터 수집
Mid-Level
20개 질문dbt - 기초
Mid-Level
20개 질문Apache Airflow - 기초
Mid-Level
20개 질문Kubernetes - 기초
Mid-Level
20개 질문dbt - 고급 기능
Senior
20개 질문ETL / ELT / ETLT 패턴
Senior
20개 질문Apache Airflow - 고급
Senior
20개 질문Airflow + dbt - 파이프라인 오케스트레이션
Senior
20개 질문PySpark - 대규모 처리
Senior
20개 질문Google Pub/Sub - 데이터 스트리밍
Senior
20개 질문Apache Beam & Dataflow
Senior
20개 질문Kubernetes - 프로덕션 및 스케일링
Senior
20개 질문Terraform - Infrastructure as Code
Senior
20개 질문NoSQL 데이터베이스
Senior
20개 질문모던 Data Architecture
Senior
20개 질문모니터링 및 관찰 가능성
Senior
20개 질문IAM 및 데이터 보안
Senior
20개 질문