
dbt - 基礎
dbtプロジェクト、models、sources、refs、tests、ドキュメント、materializations (table、view、incremental)、seeds
20 面接問題·
Mid-Level
1dbt (data build tool) とは何ですか?
1
dbt (data build tool) とは何ですか?
回答
dbtは、SQLで変換を記述しdata warehouseで実行できるデータ変換ツールです。ソフトウェアエンジニアリングの原則(バージョン管理、テスト、ドキュメント化)をデータ変換作業に適用します。dbtは抽出やロード(ELTのEとL)を行わず、変換のみを行います。
2dbtプロジェクトの基本的な構造は何ですか?
2
dbtプロジェクトの基本的な構造は何ですか?
回答
dbtプロジェクトは、プロジェクト設定を定義するdbt_project.ymlファイルをルートに含みます。主要なフォルダはmodels(SQLファイルを含む)、カスタムtests用のtests、Jinjaマクロ用のmacros、CSVファイル用のseeds、履歴データキャプチャ用のsnapshotsです。profiles.ymlファイル(通常プロジェクト外)はwarehouseへの接続を定義します。
3dbtにおけるprofiles.ymlファイルの役割は何ですか?
3
dbtにおけるprofiles.ymlファイルの役割は何ですか?
回答
profiles.ymlファイルには、data warehouse(BigQuery、Snowflake、Redshift、PostgreSQLなど)への接続情報が含まれます。機密性の高い認証情報をバージョン管理しないように、通常プロジェクト内ではなく~/.dbt/フォルダに保存されます。各プロファイルは複数のターゲット(dev、prod)を持つことができ、環境間の切り替えが容易になります。
4
dbtにおけるmodelとは何ですか?
5
dbtにおけるref()関数の役割は何ですか?
+17 面接問題
その他のData Engineering面接トピック
Linux & Shell - 基礎
Junior
20問Git & GitHub - 基礎
Junior
20問データエンジニアリングのための高度なPython
Junior
25問Docker - 基礎
Junior
25問Google Cloud Platform - 基礎
Junior
20問CI/CDとコード品質
Mid-Level
20問Docker Compose
Mid-Level
20問FastAPI - データAPI
Mid-Level
20問Data Engineering向けの高度なSQL
Mid-Level
20問Data Lake - アーキテクチャと取り込み
Mid-Level
20問データエンジニアリングのためのBigQuery
Mid-Level
20問PostgreSQL - 管理
Mid-Level
20問Data EngineeringのためのData Modeling
Mid-Level
20問Fivetran & Airbyte - データ取り込み
Mid-Level
20問Apache Airflow - 基礎
Mid-Level
20問Kubernetes - 基礎
Mid-Level
20問dbt - 高度な機能
Senior
20問ETL / ELT / ETLT パターン
Senior
20問Apache Airflow - 上級
Senior
20問Airflow + dbt - パイプラインオーケストレーション
Senior
20問PySpark - 大規模処理
Senior
20問Google Pub/Sub - データストリーミング
Senior
20問Apache Beam & Dataflow
Senior
20問Kubernetes - 本番環境とスケーリング
Senior
20問Terraform - Infrastructure as Code
Senior
20問NoSQLデータベース
Senior
20問モダンなData Architecture
Senior
20問モニタリングとオブザーバビリティ
Senior
20問IAMとデータセキュリティ
Senior
20問