
Google Pub/Sub - Streaming de données
Topics, subscriptions, push vs pull, ordering, dead lettering, exactly-once delivery, monitoring, schema registry
1Quelle est la principale caractéristique architecturale de Google Pub/Sub ?
Quelle est la principale caractéristique architecturale de Google Pub/Sub ?
Réponse
Google Pub/Sub est un service de messagerie asynchrone serverless qui découple les producteurs des consommateurs de messages. Les publishers envoient des messages à des topics sans connaître les subscribers, et les subscribers reçoivent les messages via des subscriptions sans connaître les publishers. Cette architecture permet une scalabilité horizontale indépendante des deux côtés.
2Quelle est la différence fondamentale entre un topic et une subscription dans Pub/Sub ?
Quelle est la différence fondamentale entre un topic et une subscription dans Pub/Sub ?
Réponse
Un topic est un canal nommé vers lequel les publishers envoient des messages, tandis qu'une subscription est une entité nommée représentant l'intérêt d'un subscriber à recevoir les messages d'un topic. Un topic peut avoir plusieurs subscriptions, et chaque subscription reçoit une copie de chaque message publié sur le topic.
3Dans quel cas privilégier une subscription pull plutôt qu'une subscription push ?
Dans quel cas privilégier une subscription pull plutôt qu'une subscription push ?
Réponse
Une subscription pull est préférable lorsque le subscriber doit contrôler le rythme de consommation des messages (flow control), traiter des batches volumineux, ou quand l'environnement d'exécution ne peut pas exposer d'endpoint HTTPS public. Pull permet aussi de gérer plus facilement les pics de charge en ajustant dynamiquement le nombre de messages récupérés.
Comment fonctionne le mécanisme d'acknowledgement dans Pub/Sub ?
Quel est le rôle d'un dead letter topic dans Pub/Sub ?
+17 questions d'entretien
Autres sujets d'entretien Data Engineering
Linux & Shell - Fondamentaux
Git & GitHub - Fondamentaux
Python avancé pour le Data Engineering
Docker - Fondamentaux
Google Cloud Platform - Fondamentaux
CI/CD et qualité de code
Docker Compose
FastAPI - APIs de données
SQL avancé pour le Data Engineering
Data Lake - Architecture et ingestion
BigQuery pour le Data Engineering
PostgreSQL - Administration
Data Modeling pour le Data Engineering
Fivetran & Airbyte - Ingestion de données
dbt - Fondamentaux
Apache Airflow - Fondamentaux
Kubernetes - Fondamentaux
dbt - Fonctionnalités avancées
Patterns ETL / ELT / ETLT
Apache Airflow - Avancé
Airflow + dbt - Orchestration de pipelines
PySpark - Traitement à grande échelle
Apache Beam & Dataflow
Kubernetes - Production et scaling
Terraform - Infrastructure as Code
Bases de données NoSQL
Architecture Data moderne
Monitoring et observabilité
IAM et sécurité des données
Maîtrise Data Engineering pour ton prochain entretien
Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.
Commencer gratuitement