Question 1

star schema란 무엇입니까?

Accepted Answer

star schema는 중앙의 fact table이 dimension table로 둘러싸인 차원 데이터 모델입니다. fact table에는 메트릭과 dimension에 대한 foreign key가 포함되며, dimension에는 설명 속성이 포함됩니다. 이 간단하고 비정규화된 구조는 join을 최소화하여 분석 쿼리 성능을 최적화합니다.

Question 2

fact table과 dimension table의 차이점은 무엇입니까?

Accepted Answer

fact table에는 정량적 측정값(메트릭)과 dimension에 대한 foreign key가 포함됩니다. 이벤트나 트랜잭션을 기록합니다. dimension table에는 fact를 필터링하고 그룹화할 수 있는 설명 속성(누가, 무엇을, 어디서, 언제)이 포함됩니다. fact는 숫자이며 집계 가능하고, dimension은 텍스트이며 설명적입니다.

Question 3

fact table의 grain이란 무엇입니까?

Accepted Answer

grain은 fact table에서 한 행의 세부 수준을 정의합니다. 한 행이 정확히 무엇을 나타내는가라는 질문에 답합니다. 예를 들어, 행당 한 건의 판매, 일자별 제품당 한 건의 판매, 시간당 한 건의 판매입니다. grain을 정의하는 것은 차원 모델링의 첫 번째 단계로, 어떤 dimension이 필요하고 어떤 수준의 집계가 저장되는지 결정합니다.

Data Engineering을 위한 Data Modeling

star schema란 무엇입니까?

답변

fact table과 dimension table의 차이점은 무엇입니까?

답변

fact table의 grain이란 무엇입니까?

답변

star schema와 snowflake schema의 차이점은 무엇입니까?

conformed dimension이란 무엇입니까?

기타 Data Engineering 면접 주제

Linux & Shell - 기초

Git & GitHub - 기초

데이터 엔지니어링을 위한 고급 Python

Docker - 기초

Google Cloud Platform - 기초

CI/CD 및 코드 품질

Docker Compose

FastAPI - 데이터 API

Data Engineering을 위한 고급 SQL

Data Lake - 아키텍처 및 수집

데이터 엔지니어링을 위한 BigQuery

PostgreSQL - 관리

Fivetran & Airbyte - 데이터 수집

dbt - 기초

Apache Airflow - 기초

Kubernetes - 기초

dbt - 고급 기능

ETL / ELT / ETLT 패턴

Apache Airflow - 고급

Airflow + dbt - 파이프라인 오케스트레이션

PySpark - 대규모 처리

Google Pub/Sub - 데이터 스트리밍

Apache Beam & Dataflow

Kubernetes - 프로덕션 및 스케일링

Terraform - Infrastructure as Code

NoSQL 데이터베이스

모던 Data Architecture

모니터링 및 관찰 가능성

IAM 및 데이터 보안

다음 면접을 위해 Data Engineering을 마스터하세요