Question 1

Qual è la principale caratteristica architetturale di Google Pub/Sub?

Accepted Answer

Google Pub/Sub è un servizio di messaggistica asincrona serverless che disaccoppia i produttori dai consumatori di messaggi. I publisher inviano messaggi ai topic senza conoscere i subscriber, e i subscriber ricevono i messaggi tramite subscription senza conoscere i publisher. Questa architettura consente una scalabilità orizzontale indipendente su entrambi i lati.

Question 2

Qual è la differenza fondamentale tra un topic e una subscription in Pub/Sub?

Accepted Answer

Un topic è un canale denominato a cui i publisher inviano messaggi, mentre una subscription è un'entità denominata che rappresenta l'interesse di un subscriber a ricevere messaggi da un topic. Un topic può avere più subscription, e ogni subscription riceve una copia di ogni messaggio pubblicato sul topic.

Question 3

In quale caso preferire una subscription pull rispetto a una subscription push?

Accepted Answer

Una subscription pull è preferibile quando il subscriber deve controllare il tasso di consumo dei messaggi (flow control), elaborare batch voluminosi, o quando l'ambiente di esecuzione non può esporre un endpoint HTTPS pubblico. Pull facilita anche la gestione dei picchi di carico regolando dinamicamente il numero di messaggi recuperati.

Google Pub/Sub - Streaming di dati

Qual è la principale caratteristica architetturale di Google Pub/Sub?

Risposta

Qual è la differenza fondamentale tra un topic e una subscription in Pub/Sub?

Risposta

In quale caso preferire una subscription pull rispetto a una subscription push?

Risposta

Come funziona il meccanismo di acknowledgement in Pub/Sub?

Qual è il ruolo di un dead letter topic in Pub/Sub?

Altri argomenti di colloquio Data Engineering

Linux & Shell - Fondamenti

Git & GitHub - Fondamenti

Python avanzato per Data Engineering

Docker - Fondamenti

Google Cloud Platform - Fondamenti

CI/CD e qualità del codice

Docker Compose

FastAPI - API per dati

SQL avanzato per il Data Engineering

Data Lake - Architettura e ingestione

BigQuery per il Data Engineering

PostgreSQL - Amministrazione

Data Modeling per Data Engineering

Fivetran & Airbyte - Ingestione dati

dbt - Fondamenti

Apache Airflow - Fondamenti

Kubernetes - Fondamenti

dbt - Funzionalità avanzate

Pattern ETL / ELT / ETLT

Apache Airflow - Avanzato

Airflow + dbt - Orchestrazione delle pipeline

PySpark - Elaborazione su larga scala

Apache Beam & Dataflow

Kubernetes - Produzione e scaling

Terraform - Infrastructure as Code

Database NoSQL

Data Architecture moderna

Monitoraggio e osservabilità

IAM e sicurezza dei dati

Padroneggia Data Engineering per il tuo prossimo colloquio