Data Analytics

dbt - Fondamenti

Progetto dbt, models, sources, refs, tests, documentazione, materializations, seeds

20 domande da colloquio·
Mid-Level
1

Cos'è dbt (data build tool)?

Risposta

dbt è uno strumento di trasformazione dei dati che permette ad analisti e data engineer di scrivere trasformazioni in SQL o Python direttamente nel data warehouse. Segue l'approccio ELT (Extract, Load, Transform) in cui i dati vengono prima caricati nel warehouse e poi trasformati sul posto, a differenza dell'ETL tradizionale che trasforma prima del caricamento. dbt gestisce automaticamente le dipendenze tra model, i test e la documentazione.

2

Qual è la struttura di base di un progetto dbt?

Risposta

Un progetto dbt è organizzato intorno a cartelle chiave: models/ contiene i file SQL che definiscono le trasformazioni, seeds/ contiene i file CSV caricati come tabelle, tests/ memorizza i test personalizzati, macros/ ha funzioni Jinja riutilizzabili e snapshots/ conserva le acquisizioni di stato. Il file dbt_project.yml nella radice configura il progetto (nome, versione, materializations predefinite), mentre profiles.yml definisce le connessioni al warehouse.

3

Cos'è un model in dbt?

Risposta

Un model dbt è un file SQL contenente un'istruzione SELECT che definisce una trasformazione dei dati. Ogni model corrisponde a un file .sql nella cartella models/ e produce una tabella o vista nel data warehouse quando eseguito. I model possono fare riferimento ad altri model tramite la funzione ref(), creando un grafo di dipendenze (DAG) che dbt esegue nell'ordine corretto.

4

Qual è lo scopo della funzione ref() in dbt?

5

Cos'è una source in dbt e come si dichiara?

+17 domande da colloquio

Padroneggia Data Analytics per il tuo prossimo colloquio

Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.

Inizia gratis