
dbt - Fundamentos
Proyecto dbt, models, sources, refs, tests, documentación, materializations, seeds
1¿Qué es dbt (data build tool)?
¿Qué es dbt (data build tool)?
Respuesta
dbt es una herramienta de transformación de datos que permite a los analistas e ingenieros de datos escribir transformaciones en SQL o Python directamente en el data warehouse. Sigue el enfoque ELT (Extract, Load, Transform) donde los datos se cargan primero en el warehouse y luego se transforman en su lugar, a diferencia del ETL tradicional que transforma antes de cargar. dbt gestiona automáticamente las dependencias entre models, los tests y la documentación.
2¿Cuál es la estructura básica de un proyecto dbt?
¿Cuál es la estructura básica de un proyecto dbt?
Respuesta
Un proyecto dbt se organiza en torno a carpetas clave: models/ contiene los archivos SQL que definen las transformaciones, seeds/ los archivos CSV cargados como tablas, tests/ los tests personalizados, macros/ las funciones Jinja reutilizables, y snapshots/ las capturas de estado. El archivo dbt_project.yml en la raíz configura el proyecto (nombre, versión, materializations por defecto), mientras que profiles.yml define las conexiones al warehouse.
3¿Qué es un model en dbt?
¿Qué es un model en dbt?
Respuesta
Un model dbt es un archivo SQL que contiene una instrucción SELECT que define una transformación de datos. Cada model corresponde a un archivo .sql en la carpeta models/ y produce una tabla o vista en el data warehouse al ejecutarse. Los models pueden referenciar otros models mediante la función ref(), creando un grafo de dependencias (DAG) que dbt ejecuta en el orden correcto.
¿Para qué sirve la función ref() en dbt?
¿Qué es una source en dbt y cómo declararla?
+17 preguntas de entrevista
Otros temas de entrevista Data Analytics
Google Sheets - Fundamentos
Google Sheets - Fórmulas avanzadas
SQL - Fundamentos
SQL - Agregaciones y agrupamientos
SQL - Joins
BigQuery - Fundamentos
Data Cleaning - Limpieza de datos
KPIs y métricas de negocio
Estadística descriptiva
Zapier y automatización No-Code
Principios de visualización de datos
Python & Pandas - Fundamentos
Google Sheets - Dashboards automatizados
SQL - Subconsultas y CTEs
SQL - Window Functions
BigQuery - Funcionalidades avanzadas
Data Modeling
Análisis de funnels y conversión
Análisis de cohortes y retención
Google Tag Manager y tracking
APIs y webhooks
AB Testing y estadística aplicada
Looker Studio (Google Data Studio)
Power BI - Fundamentos
SQL - Consultas analíticas avanzadas
dbt - Funciones avanzadas
Power BI - DAX y dashboards avanzados
Python Analytics - Análisis avanzado y ML
Domina Data Analytics para tu próxima entrevista
Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.
Empieza gratis