
dbt - Fondamenti
Progetto dbt, models, sources, refs, tests, documentazione, materializations, seeds
1Cos'è dbt (data build tool)?
Cos'è dbt (data build tool)?
Risposta
dbt è uno strumento di trasformazione dei dati che permette ad analisti e data engineer di scrivere trasformazioni in SQL o Python direttamente nel data warehouse. Segue l'approccio ELT (Extract, Load, Transform) in cui i dati vengono prima caricati nel warehouse e poi trasformati sul posto, a differenza dell'ETL tradizionale che trasforma prima del caricamento. dbt gestisce automaticamente le dipendenze tra model, i test e la documentazione.
2Qual è la struttura di base di un progetto dbt?
Qual è la struttura di base di un progetto dbt?
Risposta
Un progetto dbt è organizzato intorno a cartelle chiave: models/ contiene i file SQL che definiscono le trasformazioni, seeds/ contiene i file CSV caricati come tabelle, tests/ memorizza i test personalizzati, macros/ ha funzioni Jinja riutilizzabili e snapshots/ conserva le acquisizioni di stato. Il file dbt_project.yml nella radice configura il progetto (nome, versione, materializations predefinite), mentre profiles.yml definisce le connessioni al warehouse.
3Cos'è un model in dbt?
Cos'è un model in dbt?
Risposta
Un model dbt è un file SQL contenente un'istruzione SELECT che definisce una trasformazione dei dati. Ogni model corrisponde a un file .sql nella cartella models/ e produce una tabella o vista nel data warehouse quando eseguito. I model possono fare riferimento ad altri model tramite la funzione ref(), creando un grafo di dipendenze (DAG) che dbt esegue nell'ordine corretto.
Qual è lo scopo della funzione ref() in dbt?
Cos'è una source in dbt e come si dichiara?
+17 domande da colloquio
Altri argomenti di colloquio Data Analytics
Google Sheets - Fondamenti
Google Sheets - Formule avanzate
SQL - Fondamenti
SQL - Aggregazioni e raggruppamenti
SQL - Join
BigQuery - Fondamenti
Data Cleaning - Pulizia dei dati
KPI e metriche di business
Statistica descrittiva
Zapier e automazione No-Code
Principi di data visualization
Python & Pandas - Fondamenti
Google Sheets - Dashboard automatizzate
SQL - Subquery e CTE
SQL - Window Functions
BigQuery - Funzionalità avanzate
Data Modeling
Analisi di funnel e conversione
Analisi delle coorti e retention
Google Tag Manager e tracking
API e webhook
AB Testing e statistica applicata
Looker Studio (Google Data Studio)
Power BI - Fondamenti
SQL - Query analitiche avanzate
dbt - Funzionalità avanzate
Power BI - DAX e dashboard avanzate
Python Analytics - Analisi avanzata e ML
Padroneggia Data Analytics per il tuo prossimo colloquio
Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.
Inizia gratis