
Google Pub/Sub - Streaming de datos
Topics, subscriptions, push vs pull, ordering, dead lettering, exactly-once delivery, monitoring, schema registry
1¿Cuál es la principal característica arquitectónica de Google Pub/Sub?
¿Cuál es la principal característica arquitectónica de Google Pub/Sub?
Respuesta
Google Pub/Sub es un servicio de mensajería asíncrona serverless que desacopla los productores de los consumidores de mensajes. Los publishers envían mensajes a topics sin conocer a los subscribers, y los subscribers reciben mensajes a través de subscriptions sin conocer a los publishers. Esta arquitectura permite una escalabilidad horizontal independiente en ambos lados.
2¿Cuál es la diferencia fundamental entre un topic y una subscription en Pub/Sub?
¿Cuál es la diferencia fundamental entre un topic y una subscription en Pub/Sub?
Respuesta
Un topic es un canal nombrado al que los publishers envían mensajes, mientras que una subscription es una entidad nombrada que representa el interés de un subscriber en recibir mensajes de un topic. Un topic puede tener múltiples subscriptions, y cada subscription recibe una copia de cada mensaje publicado en el topic.
3¿En qué caso preferir una subscription pull en lugar de una subscription push?
¿En qué caso preferir una subscription pull en lugar de una subscription push?
Respuesta
Una subscription pull es preferible cuando el subscriber necesita controlar la tasa de consumo de mensajes (flow control), procesar lotes voluminosos, o cuando el entorno de ejecución no puede exponer un endpoint HTTPS público. Pull también facilita la gestión de picos de carga al ajustar dinámicamente el número de mensajes recuperados.
¿Cómo funciona el mecanismo de acknowledgement en Pub/Sub?
¿Cuál es el rol de un dead letter topic en Pub/Sub?
+17 preguntas de entrevista
Otros temas de entrevista Data Engineering
Linux & Shell - Fundamentos
Git & GitHub - Fundamentos
Python avanzado para Data Engineering
Docker - Fundamentos
Google Cloud Platform - Fundamentos
CI/CD y calidad de código
Docker Compose
FastAPI - APIs de datos
SQL avanzado para Data Engineering
Data Lake - Arquitectura e ingesta
BigQuery para Data Engineering
PostgreSQL - Administración
Data Modeling para Data Engineering
Fivetran & Airbyte - Ingesta de datos
dbt - Fundamentos
Apache Airflow - Fundamentos
Kubernetes - Fundamentos
dbt - Funcionalidades avanzadas
Patrones ETL / ELT / ETLT
Apache Airflow - Avanzado
Airflow + dbt - Orquestación de pipelines
PySpark - Procesamiento a gran escala
Apache Beam & Dataflow
Kubernetes - Producción y escalado
Terraform - Infrastructure as Code
Bases de datos NoSQL
Arquitectura Data moderna
Monitoreo y observabilidad
IAM y seguridad de datos
Domina Data Engineering para tu próxima entrevista
Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.
Empieza gratis