Data Engineering

dbt - Fundamentos

Projeto dbt, models, sources, refs, tests, documentação, materializations (table, view, incremental), seeds

20 perguntas de entrevista·
Mid-Level
1

O que é dbt (data build tool)?

Resposta

dbt é uma ferramenta de transformação de dados que permite escrever transformações em SQL e executá-las em um data warehouse. Aplica os princípios de software engineering (versionamento, tests, documentação) ao trabalho de transformação de dados. dbt não realiza extração nem carregamento (o E e L de ELT), apenas transformação.

2

Qual é a estrutura básica de um projeto dbt?

Resposta

Um projeto dbt contém um arquivo dbt_project.yml na raiz que define a configuração do projeto. As pastas principais são models (contendo arquivos SQL), tests para tests customizados, macros para macros Jinja, seeds para arquivos CSV, e snapshots para capturas de dados históricos. O arquivo profiles.yml (geralmente fora do projeto) define as conexões aos warehouses.

3

Qual é o papel do arquivo profiles.yml no dbt?

Resposta

O arquivo profiles.yml contém as informações de conexão aos data warehouses (BigQuery, Snowflake, Redshift, PostgreSQL, etc.). Geralmente é armazenado na pasta ~/.dbt/ e não no projeto para evitar versionar credentials sensíveis. Cada perfil pode ter vários targets (dev, prod) permitindo alternar facilmente entre ambientes.

4

O que é um model no dbt?

5

Qual é o papel da função ref() no dbt?

+17 perguntas de entrevista

Domine Data Engineering para sua proxima entrevista

Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.

Comece gratis