
Data EngineeringのためのData Modeling
Star schema、snowflake、Data Vault、正規化、SCDタイプ、grain、加法的メトリクス
20 面接問題·
Mid-Level
1star schemaとは何ですか?
1
star schemaとは何ですか?
回答
star schemaは、中央のfact tableがdimension tableに囲まれた次元データモデルです。fact tableにはメトリクスとdimensionへのforeign keyが含まれ、dimensionには記述属性が含まれます。このシンプルで非正規化された構造は、joinを最小限に抑えることで分析クエリのパフォーマンスを最適化します。
2fact tableとdimension tableの違いは何ですか?
2
fact tableとdimension tableの違いは何ですか?
回答
fact tableには定量的な測定値(メトリクス)とdimensionへのforeign keyが含まれます。イベントやトランザクションを記録します。dimension tableには記述属性(誰が、何を、どこで、いつ)が含まれ、factのフィルタリングやグループ化を可能にします。factは数値で集計可能、dimensionはテキストで記述的です。
3fact tableのgrainとは何ですか?
3
fact tableのgrainとは何ですか?
回答
grainはfact tableの1行の詳細レベルを定義します。1行が正確に何を表すかという質問に答えます。例えば、1行に1販売、1日1製品ごとに1販売、または1時間ごとに1販売です。grainの定義は次元モデリングの最初のステップであり、どのdimensionが必要か、どのレベルの集計が保存されるかを決定します。
4
star schemaとsnowflake schemaの違いは何ですか?
5
conformed dimensionとは何ですか?
+17 面接問題
その他のData Engineering面接トピック
Linux & Shell - 基礎
Junior
20問Git & GitHub - 基礎
Junior
20問データエンジニアリングのための高度なPython
Junior
25問Docker - 基礎
Junior
25問Google Cloud Platform - 基礎
Junior
20問CI/CDとコード品質
Mid-Level
20問Docker Compose
Mid-Level
20問FastAPI - データAPI
Mid-Level
20問Data Engineering向けの高度なSQL
Mid-Level
20問Data Lake - アーキテクチャと取り込み
Mid-Level
20問データエンジニアリングのためのBigQuery
Mid-Level
20問PostgreSQL - 管理
Mid-Level
20問Fivetran & Airbyte - データ取り込み
Mid-Level
20問dbt - 基礎
Mid-Level
20問Apache Airflow - 基礎
Mid-Level
20問Kubernetes - 基礎
Mid-Level
20問dbt - 高度な機能
Senior
20問ETL / ELT / ETLT パターン
Senior
20問Apache Airflow - 上級
Senior
20問Airflow + dbt - パイプラインオーケストレーション
Senior
20問PySpark - 大規模処理
Senior
20問Google Pub/Sub - データストリーミング
Senior
20問Apache Beam & Dataflow
Senior
20問Kubernetes - 本番環境とスケーリング
Senior
20問Terraform - Infrastructure as Code
Senior
20問NoSQLデータベース
Senior
20問モダンなData Architecture
Senior
20問モニタリングとオブザーバビリティ
Senior
20問IAMとデータセキュリティ
Senior
20問