Data Analytics

BigQuery - Fonctionnalités avancées

Partitionnement, clustering, vues matérialisées, UDFs, requêtes imbriquées, STRUCT, ARRAY

20 questions d'entretien·
Confirmé
1

Quel est le rôle principal du partitionnement dans BigQuery ?

Réponse

Le partitionnement permet de diviser une table en segments basés sur une colonne (souvent une date), ce qui réduit la quantité de données scannées lors des requêtes. Quand une requête filtre sur la colonne de partition, BigQuery ne lit que les partitions pertinentes au lieu de scanner la table entière. Cela améliore les performances et réduit les coûts de requête, qui sont facturés au volume de données scannées.

2

Quels sont les types de partitionnement disponibles dans BigQuery ?

Réponse

BigQuery propose trois types de partitionnement : par colonne de type DATE, TIMESTAMP ou DATETIME (le plus courant), par plage d'entiers (INTEGER RANGE), et par temps d'ingestion (_PARTITIONTIME). Le partitionnement par date est le plus utilisé car la majorité des analyses filtrent sur des périodes temporelles. Le partitionnement par plage d'entiers est utile pour les identifiants numériques.

3

Qu'est-ce qu'un STRUCT dans BigQuery ?

Réponse

Un STRUCT (ou RECORD) est un type de données qui regroupe plusieurs champs nommés de types potentiellement différents dans une seule colonne. Par exemple, un STRUCT peut contenir un nom (STRING), un âge (INT64) et un email (STRING). Les STRUCT permettent de modéliser des données hiérarchiques directement dans une table, évitant ainsi des jointures coûteuses. On accède aux champs avec la notation pointée (struct_col.field).

4

Qu'est-ce qu'un ARRAY dans BigQuery ?

5

À quoi sert la fonction UNNEST dans BigQuery ?

+17 questions d'entretien

Maîtrise Data Analytics pour ton prochain entretien

Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.

Commencer gratuitement