Data Analytics

dbt - Fundamentos

Projeto dbt, models, sources, refs, tests, documentação, materializations, seeds

20 perguntas de entrevista·
Mid-Level
1

O que é dbt (data build tool)?

Resposta

dbt é uma ferramenta de transformação de dados que permite que analistas e engenheiros de dados escrevam transformações em SQL ou Python diretamente no data warehouse. Segue a abordagem ELT (Extract, Load, Transform) onde os dados são primeiro carregados no warehouse e depois transformados no local, ao contrário do ETL tradicional que transforma antes de carregar. O dbt gerencia automaticamente as dependências entre models, os tests e a documentação.

2

Qual é a estrutura básica de um projeto dbt?

Resposta

Um projeto dbt é organizado em torno de pastas-chave: models/ contém os arquivos SQL que definem as transformações, seeds/ os arquivos CSV carregados como tabelas, tests/ os testes personalizados, macros/ as funções Jinja reutilizáveis, e snapshots/ as capturas de estado. O arquivo dbt_project.yml na raiz configura o projeto (nome, versão, materializations padrão), enquanto profiles.yml define as conexões ao warehouse.

3

O que é um model em dbt?

Resposta

Um model dbt é um arquivo SQL contendo uma instrução SELECT que define uma transformação de dados. Cada model corresponde a um arquivo .sql na pasta models/ e produz uma tabela ou view no data warehouse quando executado. Os models podem referenciar outros models via a função ref(), criando um grafo de dependências (DAG) que o dbt executa na ordem correta.

4

Para que serve a função ref() em dbt?

5

O que é uma source em dbt e como declará-la?

+17 perguntas de entrevista

Domine Data Analytics para sua proxima entrevista

Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.

Comece gratis