Question 1

Qu'est-ce que dbt (data build tool) ?

Accepted Answer

dbt est un outil de transformation de données qui permet aux analystes et ingénieurs data d'écrire des transformations en SQL ou Python directement dans le data warehouse. Il suit l'approche ELT (Extract, Load, Transform) où les données sont d'abord chargées dans le warehouse puis transformées sur place, contrairement à l'ETL classique qui transforme avant le chargement. dbt gère les dépendances entre modèles, les tests et la documentation automatiquement.

Question 2

Quelle est la structure de base d'un projet dbt ?

Accepted Answer

Un projet dbt est organisé autour de dossiers clés : models/ contient les fichiers SQL définissant les transformations, seeds/ les fichiers CSV chargés comme tables, tests/ les tests personnalisés, macros/ les fonctions Jinja réutilisables, et snapshots/ les captures d'état. Le fichier dbt_project.yml à la racine configure le projet (nom, version, materializations par défaut), tandis que profiles.yml définit les connexions au warehouse.

Question 3

Qu'est-ce qu'un model dans dbt ?

Accepted Answer

Un model dbt est un fichier SQL contenant une instruction SELECT qui définit une transformation de données. Chaque model correspond à un fichier .sql dans le dossier models/ et produit une table ou une vue dans le data warehouse lors de l'exécution. Les models peuvent référencer d'autres models via la fonction ref(), créant ainsi un graphe de dépendances (DAG) que dbt exécute dans le bon ordre.

dbt - Fondamentaux

Qu'est-ce que dbt (data build tool) ?

Réponse

Quelle est la structure de base d'un projet dbt ?

Réponse

Qu'est-ce qu'un model dans dbt ?

Réponse

À quoi sert la fonction ref() dans dbt ?

Qu'est-ce qu'une source dans dbt et comment la déclarer ?

Autres sujets d'entretien Data Analytics

Google Sheets - Les fondamentaux

Google Sheets - Formules avancées

SQL - Les fondamentaux

SQL - Agrégations et groupements

SQL - Jointures

BigQuery - Fondamentaux

Data Cleaning - Nettoyage des données

KPIs et métriques business

Statistiques descriptives

Zapier et automatisation No-Code

Principes de data visualisation

Python & Pandas - Fondamentaux

Google Sheets - Dashboards automatisés

SQL - Sous-requêtes et CTEs

SQL - Window Functions

BigQuery - Fonctionnalités avancées

Data Modeling

Analyse de funnels et conversion

Analyse de cohortes et rétention

Google Tag Manager et tracking

APIs et webhooks

AB Testing et statistiques appliquées

Looker Studio (Google Data Studio)

Power BI - Fondamentaux

SQL - Requêtes analytiques avancées

dbt - Fonctionnalités avancées

Power BI - DAX et dashboards avancés

Python Analytics - Analyse avancée et ML

Maîtrise Data Analytics pour ton prochain entretien