Data Analytics

dbt - Fundamentos

Proyecto dbt, models, sources, refs, tests, documentación, materializations, seeds

20 preguntas de entrevista·
Mid-Level
1

¿Qué es dbt (data build tool)?

Respuesta

dbt es una herramienta de transformación de datos que permite a los analistas e ingenieros de datos escribir transformaciones en SQL o Python directamente en el data warehouse. Sigue el enfoque ELT (Extract, Load, Transform) donde los datos se cargan primero en el warehouse y luego se transforman en su lugar, a diferencia del ETL tradicional que transforma antes de cargar. dbt gestiona automáticamente las dependencias entre models, los tests y la documentación.

2

¿Cuál es la estructura básica de un proyecto dbt?

Respuesta

Un proyecto dbt se organiza en torno a carpetas clave: models/ contiene los archivos SQL que definen las transformaciones, seeds/ los archivos CSV cargados como tablas, tests/ los tests personalizados, macros/ las funciones Jinja reutilizables, y snapshots/ las capturas de estado. El archivo dbt_project.yml en la raíz configura el proyecto (nombre, versión, materializations por defecto), mientras que profiles.yml define las conexiones al warehouse.

3

¿Qué es un model en dbt?

Respuesta

Un model dbt es un archivo SQL que contiene una instrucción SELECT que define una transformación de datos. Cada model corresponde a un archivo .sql en la carpeta models/ y produce una tabla o vista en el data warehouse al ejecutarse. Los models pueden referenciar otros models mediante la función ref(), creando un grafo de dependencias (DAG) que dbt ejecuta en el orden correcto.

4

¿Para qué sirve la función ref() en dbt?

5

¿Qué es una source en dbt y cómo declararla?

+17 preguntas de entrevista

Domina Data Analytics para tu próxima entrevista

Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.

Empieza gratis