
Google Pub/Sub - Streaming di dati
Topics, subscriptions, push vs pull, ordering, dead lettering, exactly-once delivery, monitoring, schema registry
1Qual è la principale caratteristica architetturale di Google Pub/Sub?
Qual è la principale caratteristica architetturale di Google Pub/Sub?
Risposta
Google Pub/Sub è un servizio di messaggistica asincrona serverless che disaccoppia i produttori dai consumatori di messaggi. I publisher inviano messaggi ai topic senza conoscere i subscriber, e i subscriber ricevono i messaggi tramite subscription senza conoscere i publisher. Questa architettura consente una scalabilità orizzontale indipendente su entrambi i lati.
2Qual è la differenza fondamentale tra un topic e una subscription in Pub/Sub?
Qual è la differenza fondamentale tra un topic e una subscription in Pub/Sub?
Risposta
Un topic è un canale denominato a cui i publisher inviano messaggi, mentre una subscription è un'entità denominata che rappresenta l'interesse di un subscriber a ricevere messaggi da un topic. Un topic può avere più subscription, e ogni subscription riceve una copia di ogni messaggio pubblicato sul topic.
3In quale caso preferire una subscription pull rispetto a una subscription push?
In quale caso preferire una subscription pull rispetto a una subscription push?
Risposta
Una subscription pull è preferibile quando il subscriber deve controllare il tasso di consumo dei messaggi (flow control), elaborare batch voluminosi, o quando l'ambiente di esecuzione non può esporre un endpoint HTTPS pubblico. Pull facilita anche la gestione dei picchi di carico regolando dinamicamente il numero di messaggi recuperati.
Come funziona il meccanismo di acknowledgement in Pub/Sub?
Qual è il ruolo di un dead letter topic in Pub/Sub?
+17 domande da colloquio
Altri argomenti di colloquio Data Engineering
Linux & Shell - Fondamenti
Git & GitHub - Fondamenti
Python avanzato per Data Engineering
Docker - Fondamenti
Google Cloud Platform - Fondamenti
CI/CD e qualità del codice
Docker Compose
FastAPI - API per dati
SQL avanzato per il Data Engineering
Data Lake - Architettura e ingestione
BigQuery per il Data Engineering
PostgreSQL - Amministrazione
Data Modeling per Data Engineering
Fivetran & Airbyte - Ingestione dati
dbt - Fondamenti
Apache Airflow - Fondamenti
Kubernetes - Fondamenti
dbt - Funzionalità avanzate
Pattern ETL / ELT / ETLT
Apache Airflow - Avanzato
Airflow + dbt - Orchestrazione delle pipeline
PySpark - Elaborazione su larga scala
Apache Beam & Dataflow
Kubernetes - Produzione e scaling
Terraform - Infrastructure as Code
Database NoSQL
Data Architecture moderna
Monitoraggio e osservabilità
IAM e sicurezza dei dati
Padroneggia Data Engineering per il tuo prossimo colloquio
Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.
Inizia gratis