Question 1

Jaka jest główna cecha architektoniczna Google Pub/Sub?

Accepted Answer

Google Pub/Sub to bezserwerowa asynchroniczna usługa wiadomości, która oddziela producentów od konsumentów wiadomości. Publishery wysyłają wiadomości do topiców bez znajomości subscriberów, a subscribery odbierają wiadomości przez subscriptions bez znajomości publisherów. Ta architektura umożliwia niezależne skalowanie poziome po obu stronach.

Question 2

Jaka jest fundamentalna różnica między topicem a subscription w Pub/Sub?

Accepted Answer

Topic to nazwany kanał, do którego publishery wysyłają wiadomości, podczas gdy subscription to nazwana encja reprezentująca zainteresowanie subscribera otrzymywaniem wiadomości z topicu. Topic może mieć wiele subscriptions, a każda subscription otrzymuje kopię każdej wiadomości opublikowanej w topicu.

Question 3

W jakim przypadku preferować pull subscription zamiast push subscription?

Accepted Answer

Pull subscription jest preferowana, gdy subscriber musi kontrolować tempo konsumpcji wiadomości (flow control), przetwarzać duże batche lub gdy środowisko wykonawcze nie może udostępnić publicznego endpointu HTTPS. Pull ułatwia również zarządzanie szczytami obciążenia poprzez dynamiczne dostosowywanie liczby pobieranych wiadomości.

Google Pub/Sub - Streaming danych

Jaka jest główna cecha architektoniczna Google Pub/Sub?

Odpowiedź

Jaka jest fundamentalna różnica między topicem a subscription w Pub/Sub?

Odpowiedź

W jakim przypadku preferować pull subscription zamiast push subscription?

Odpowiedź

Jak działa mechanizm acknowledgement w Pub/Sub?

Jaka jest rola dead letter topic w Pub/Sub?

Inne tematy rekrutacyjne Data Engineering

Linux & Shell - Podstawy

Git & GitHub - Podstawy

Zaawansowany Python dla Data Engineering

Docker - Podstawy

Google Cloud Platform - Podstawy

CI/CD i jakość kodu

Docker Compose

FastAPI - API danych

Zaawansowany SQL dla Data Engineering

Data Lake - Architektura i wprowadzanie danych

BigQuery dla Data Engineering

PostgreSQL - Administracja

Data Modeling dla Data Engineering

Fivetran & Airbyte - Pozyskiwanie danych

dbt - Podstawy

Apache Airflow - Podstawy

Kubernetes - Podstawy

dbt - Zaawansowane funkcje

Wzorce ETL / ELT / ETLT

Apache Airflow - Zaawansowany

Airflow + dbt - Orkiestracja pipeline'ów

PySpark - Przetwarzanie na dużą skalę

Apache Beam & Dataflow

Kubernetes - Produkcja i skalowanie

Terraform - Infrastructure as Code

Bazy danych NoSQL

Nowoczesna Data Architecture

Monitorowanie i obserwowalność

IAM i bezpieczeństwo danych

Opanuj Data Engineering na następną rozmowę