
dbt - Fundamentos
Projeto dbt, models, sources, refs, tests, documentação, materializations, seeds
1O que é dbt (data build tool)?
O que é dbt (data build tool)?
Resposta
dbt é uma ferramenta de transformação de dados que permite que analistas e engenheiros de dados escrevam transformações em SQL ou Python diretamente no data warehouse. Segue a abordagem ELT (Extract, Load, Transform) onde os dados são primeiro carregados no warehouse e depois transformados no local, ao contrário do ETL tradicional que transforma antes de carregar. O dbt gerencia automaticamente as dependências entre models, os tests e a documentação.
2Qual é a estrutura básica de um projeto dbt?
Qual é a estrutura básica de um projeto dbt?
Resposta
Um projeto dbt é organizado em torno de pastas-chave: models/ contém os arquivos SQL que definem as transformações, seeds/ os arquivos CSV carregados como tabelas, tests/ os testes personalizados, macros/ as funções Jinja reutilizáveis, e snapshots/ as capturas de estado. O arquivo dbt_project.yml na raiz configura o projeto (nome, versão, materializations padrão), enquanto profiles.yml define as conexões ao warehouse.
3O que é um model em dbt?
O que é um model em dbt?
Resposta
Um model dbt é um arquivo SQL contendo uma instrução SELECT que define uma transformação de dados. Cada model corresponde a um arquivo .sql na pasta models/ e produz uma tabela ou view no data warehouse quando executado. Os models podem referenciar outros models via a função ref(), criando um grafo de dependências (DAG) que o dbt executa na ordem correta.
Para que serve a função ref() em dbt?
O que é uma source em dbt e como declará-la?
+17 perguntas de entrevista
Outros temas de entrevista Data Analytics
Google Sheets - Fundamentos
Google Sheets - Fórmulas avançadas
SQL - Fundamentos
SQL - Agregações e agrupamentos
SQL - Joins
BigQuery - Fundamentos
Data Cleaning - Limpeza de dados
KPIs e métricas de negócio
Estatística descritiva
Zapier e automação No-Code
Princípios de visualização de dados
Python & Pandas - Fundamentos
Google Sheets - Dashboards automatizados
SQL - Subconsultas e CTEs
SQL - Window Functions
BigQuery - Recursos avançados
Data Modeling
Análise de funis e conversão
Análise de coortes e retenção
Google Tag Manager e tracking
APIs e webhooks
AB Testing e estatística aplicada
Looker Studio (Google Data Studio)
Power BI - Fundamentos
SQL - Consultas analíticas avançadas
dbt - Recursos avançados
Power BI - DAX e dashboards avançados
Python Analytics - Análise avançada e ML
Domine Data Analytics para sua proxima entrevista
Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.
Comece gratis