Data Analytics

dbt - 基礎

dbtプロジェクト、models、sources、refs、tests、ドキュメント、materializations、seeds

20 面接問題·
Mid-Level
1

dbt(data build tool)とは何ですか?

回答

dbtは、アナリストやデータエンジニアがSQLまたはPythonでデータウェアハウス内で直接変換を記述できるデータ変換ツールです。従来のETLが読み込み前に変換するのに対し、データを先にウェアハウスに読み込んでからその場で変換するELT(Extract、Load、Transform)アプローチに従います。dbtはモデル間の依存関係、テスト、ドキュメントを自動的に管理します。

2

dbtプロジェクトの基本構造は何ですか?

回答

dbtプロジェクトは主要なフォルダーを中心に編成されます:models/には変換を定義するSQLファイル、seeds/にはテーブルとして読み込まれるCSVファイル、tests/にはカスタムテスト、macros/には再利用可能なJinja関数、snapshots/には状態キャプチャが含まれます。ルートのdbt_project.ymlファイルはプロジェクト(名前、バージョン、デフォルトのmaterializations)を設定し、profiles.ymlはウェアハウス接続を定義します。

3

dbtのmodelとは何ですか?

回答

dbtのmodelは、データ変換を定義するSELECT文を含むSQLファイルです。各modelはmodels/フォルダー内の.sqlファイルに対応し、実行時にデータウェアハウスにテーブルまたはビューを生成します。modelはref()関数を介して他のmodelを参照でき、dbtが正しい順序で実行する依存関係グラフ(DAG)を作成します。

4

dbtのref()関数の目的は何ですか?

5

dbtのsourceとは何で、どのように宣言しますか?

+17 面接問題

次の面接に向けてData Analyticsをマスター

すべての問題、flashcards、技術テスト、コードレビュー演習、面接シミュレーターにアクセス。

無料で始める