Question 1

Quel est le rôle principal du partitionnement dans BigQuery ?

Accepted Answer

Le partitionnement permet de diviser une table en segments basés sur une colonne (souvent une date), ce qui réduit la quantité de données scannées lors des requêtes. Quand une requête filtre sur la colonne de partition, BigQuery ne lit que les partitions pertinentes au lieu de scanner la table entière. Cela améliore les performances et réduit les coûts de requête, qui sont facturés au volume de données scannées.

Question 2

Quels sont les types de partitionnement disponibles dans BigQuery ?

Accepted Answer

BigQuery propose trois types de partitionnement : par colonne de type DATE, TIMESTAMP ou DATETIME (le plus courant), par plage d'entiers (INTEGER RANGE), et par temps d'ingestion (_PARTITIONTIME). Le partitionnement par date est le plus utilisé car la majorité des analyses filtrent sur des périodes temporelles. Le partitionnement par plage d'entiers est utile pour les identifiants numériques.

Question 3

Qu'est-ce qu'un STRUCT dans BigQuery ?

Accepted Answer

Un STRUCT (ou RECORD) est un type de données qui regroupe plusieurs champs nommés de types potentiellement différents dans une seule colonne. Par exemple, un STRUCT peut contenir un nom (STRING), un âge (INT64) et un email (STRING). Les STRUCT permettent de modéliser des données hiérarchiques directement dans une table, évitant ainsi des jointures coûteuses. On accède aux champs avec la notation pointée (struct_col.field).

BigQuery - Fonctionnalités avancées

Quel est le rôle principal du partitionnement dans BigQuery ?

Réponse

Quels sont les types de partitionnement disponibles dans BigQuery ?

Réponse

Qu'est-ce qu'un STRUCT dans BigQuery ?

Réponse

Qu'est-ce qu'un ARRAY dans BigQuery ?

À quoi sert la fonction UNNEST dans BigQuery ?

Autres sujets d'entretien Data Analytics

Google Sheets - Les fondamentaux

Google Sheets - Formules avancées

SQL - Les fondamentaux

SQL - Agrégations et groupements

SQL - Jointures

BigQuery - Fondamentaux

Data Cleaning - Nettoyage des données

KPIs et métriques business

Statistiques descriptives

Zapier et automatisation No-Code

Principes de data visualisation

Python & Pandas - Fondamentaux

Google Sheets - Dashboards automatisés

SQL - Sous-requêtes et CTEs

SQL - Window Functions

Data Modeling

Analyse de funnels et conversion

Analyse de cohortes et rétention

Google Tag Manager et tracking

APIs et webhooks

dbt - Fondamentaux

AB Testing et statistiques appliquées

Looker Studio (Google Data Studio)

Power BI - Fondamentaux

SQL - Requêtes analytiques avancées

dbt - Fonctionnalités avancées

Power BI - DAX et dashboards avancés

Python Analytics - Analyse avancée et ML

Maîtrise Data Analytics pour ton prochain entretien