
BigQuery - Fonctionnalités avancées
Partitionnement, clustering, vues matérialisées, UDFs, requêtes imbriquées, STRUCT, ARRAY
1Quel est le rôle principal du partitionnement dans BigQuery ?
Quel est le rôle principal du partitionnement dans BigQuery ?
Réponse
Le partitionnement permet de diviser une table en segments basés sur une colonne (souvent une date), ce qui réduit la quantité de données scannées lors des requêtes. Quand une requête filtre sur la colonne de partition, BigQuery ne lit que les partitions pertinentes au lieu de scanner la table entière. Cela améliore les performances et réduit les coûts de requête, qui sont facturés au volume de données scannées.
2Quels sont les types de partitionnement disponibles dans BigQuery ?
Quels sont les types de partitionnement disponibles dans BigQuery ?
Réponse
BigQuery propose trois types de partitionnement : par colonne de type DATE, TIMESTAMP ou DATETIME (le plus courant), par plage d'entiers (INTEGER RANGE), et par temps d'ingestion (_PARTITIONTIME). Le partitionnement par date est le plus utilisé car la majorité des analyses filtrent sur des périodes temporelles. Le partitionnement par plage d'entiers est utile pour les identifiants numériques.
3Qu'est-ce qu'un STRUCT dans BigQuery ?
Qu'est-ce qu'un STRUCT dans BigQuery ?
Réponse
Un STRUCT (ou RECORD) est un type de données qui regroupe plusieurs champs nommés de types potentiellement différents dans une seule colonne. Par exemple, un STRUCT peut contenir un nom (STRING), un âge (INT64) et un email (STRING). Les STRUCT permettent de modéliser des données hiérarchiques directement dans une table, évitant ainsi des jointures coûteuses. On accède aux champs avec la notation pointée (struct_col.field).
Qu'est-ce qu'un ARRAY dans BigQuery ?
À quoi sert la fonction UNNEST dans BigQuery ?
+17 questions d'entretien
Autres sujets d'entretien Data Analytics
Google Sheets - Les fondamentaux
Google Sheets - Formules avancées
SQL - Les fondamentaux
SQL - Agrégations et groupements
SQL - Jointures
BigQuery - Fondamentaux
Data Cleaning - Nettoyage des données
KPIs et métriques business
Statistiques descriptives
Zapier et automatisation No-Code
Principes de data visualisation
Python & Pandas - Fondamentaux
Google Sheets - Dashboards automatisés
SQL - Sous-requêtes et CTEs
SQL - Window Functions
Data Modeling
Analyse de funnels et conversion
Analyse de cohortes et rétention
Google Tag Manager et tracking
APIs et webhooks
dbt - Fondamentaux
AB Testing et statistiques appliquées
Looker Studio (Google Data Studio)
Power BI - Fondamentaux
SQL - Requêtes analytiques avancées
dbt - Fonctionnalités avancées
Power BI - DAX et dashboards avancés
Python Analytics - Analyse avancée et ML
Maîtrise Data Analytics pour ton prochain entretien
Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.
Commencer gratuitement