Data Engineering

dbt - 基礎

dbtプロジェクト、models、sources、refs、tests、ドキュメント、materializations (table、view、incremental)、seeds

20 面接問題·
Mid-Level
1

dbt (data build tool) とは何ですか?

回答

dbtは、SQLで変換を記述しdata warehouseで実行できるデータ変換ツールです。ソフトウェアエンジニアリングの原則(バージョン管理、テスト、ドキュメント化)をデータ変換作業に適用します。dbtは抽出やロード(ELTのEとL)を行わず、変換のみを行います。

2

dbtプロジェクトの基本的な構造は何ですか?

回答

dbtプロジェクトは、プロジェクト設定を定義するdbt_project.ymlファイルをルートに含みます。主要なフォルダはmodels(SQLファイルを含む)、カスタムtests用のtests、Jinjaマクロ用のmacros、CSVファイル用のseeds、履歴データキャプチャ用のsnapshotsです。profiles.ymlファイル(通常プロジェクト外)はwarehouseへの接続を定義します。

3

dbtにおけるprofiles.ymlファイルの役割は何ですか?

回答

profiles.ymlファイルには、data warehouse(BigQuery、Snowflake、Redshift、PostgreSQLなど)への接続情報が含まれます。機密性の高い認証情報をバージョン管理しないように、通常プロジェクト内ではなく~/.dbt/フォルダに保存されます。各プロファイルは複数のターゲット(dev、prod)を持つことができ、環境間の切り替えが容易になります。

4

dbtにおけるmodelとは何ですか?

5

dbtにおけるref()関数の役割は何ですか?

+17 面接問題

次の面接に向けてData Engineeringをマスター

すべての問題、flashcards、技術テスト、コードレビュー演習、面接シミュレーターにアクセス。

無料で始める