Data Science & ML

BigQuery & Cloud Data

BigQuery, requêtes SQL à grande échelle, partitionnement, datasets publics, coûts, optimisation

18 questions d'entretien·
Confirmé
1

Qu'est-ce que Google BigQuery ?

Réponse

BigQuery est un entrepôt de données (data warehouse) serverless, hautement scalable et économique proposé par Google Cloud Platform. Il permet d'exécuter des requêtes SQL analytiques sur des pétaoctets de données en quelques secondes grâce à son architecture distribuée. Contrairement aux bases de données traditionnelles, BigQuery sépare le stockage du calcul, ce qui permet une facturation à l'usage et une scalabilité quasi illimitée.

2

Quel est le principal avantage de l'architecture serverless de BigQuery ?

Réponse

L'architecture serverless de BigQuery signifie qu'il n'y a pas d'infrastructure à gérer : pas de provisionnement de serveurs, pas de configuration de clusters, pas de maintenance. Google gère automatiquement les ressources en fonction de la charge. Cela permet de se concentrer sur les requêtes et l'analyse plutôt que sur l'administration système, tout en bénéficiant d'une scalabilité automatique.

3

Comment BigQuery facture-t-il les requêtes en mode on-demand ?

Réponse

En mode on-demand, BigQuery facture en fonction de la quantité de données scannées par la requête, pas du temps d'exécution ni du nombre de lignes retournées. Le premier téraoctet scanné par mois est gratuit. Il est donc crucial d'optimiser les requêtes en sélectionnant uniquement les colonnes nécessaires et en utilisant le partitionnement pour réduire les coûts.

4

Qu'est-ce qu'un dataset dans BigQuery ?

5

Qu'est-ce que le partitionnement de table dans BigQuery et quel est son principal avantage ?

+15 questions d'entretien

Maîtrise Data Science & ML pour ton prochain entretien

Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.

Commencer gratuitement