
Google Pub/Sub - Streaming danych
Topics, subscriptions, push vs pull, ordering, dead lettering, exactly-once delivery, monitoring, schema registry
1Jaka jest główna cecha architektoniczna Google Pub/Sub?
Jaka jest główna cecha architektoniczna Google Pub/Sub?
Odpowiedź
Google Pub/Sub to bezserwerowa asynchroniczna usługa wiadomości, która oddziela producentów od konsumentów wiadomości. Publishery wysyłają wiadomości do topiców bez znajomości subscriberów, a subscribery odbierają wiadomości przez subscriptions bez znajomości publisherów. Ta architektura umożliwia niezależne skalowanie poziome po obu stronach.
2Jaka jest fundamentalna różnica między topicem a subscription w Pub/Sub?
Jaka jest fundamentalna różnica między topicem a subscription w Pub/Sub?
Odpowiedź
Topic to nazwany kanał, do którego publishery wysyłają wiadomości, podczas gdy subscription to nazwana encja reprezentująca zainteresowanie subscribera otrzymywaniem wiadomości z topicu. Topic może mieć wiele subscriptions, a każda subscription otrzymuje kopię każdej wiadomości opublikowanej w topicu.
3W jakim przypadku preferować pull subscription zamiast push subscription?
W jakim przypadku preferować pull subscription zamiast push subscription?
Odpowiedź
Pull subscription jest preferowana, gdy subscriber musi kontrolować tempo konsumpcji wiadomości (flow control), przetwarzać duże batche lub gdy środowisko wykonawcze nie może udostępnić publicznego endpointu HTTPS. Pull ułatwia również zarządzanie szczytami obciążenia poprzez dynamiczne dostosowywanie liczby pobieranych wiadomości.
Jak działa mechanizm acknowledgement w Pub/Sub?
Jaka jest rola dead letter topic w Pub/Sub?
+17 pytań z rozmów
Inne tematy rekrutacyjne Data Engineering
Linux & Shell - Podstawy
Git & GitHub - Podstawy
Zaawansowany Python dla Data Engineering
Docker - Podstawy
Google Cloud Platform - Podstawy
CI/CD i jakość kodu
Docker Compose
FastAPI - API danych
Zaawansowany SQL dla Data Engineering
Data Lake - Architektura i wprowadzanie danych
BigQuery dla Data Engineering
PostgreSQL - Administracja
Data Modeling dla Data Engineering
Fivetran & Airbyte - Pozyskiwanie danych
dbt - Podstawy
Apache Airflow - Podstawy
Kubernetes - Podstawy
dbt - Zaawansowane funkcje
Wzorce ETL / ELT / ETLT
Apache Airflow - Zaawansowany
Airflow + dbt - Orkiestracja pipeline'ów
PySpark - Przetwarzanie na dużą skalę
Apache Beam & Dataflow
Kubernetes - Produkcja i skalowanie
Terraform - Infrastructure as Code
Bazy danych NoSQL
Nowoczesna Data Architecture
Monitorowanie i obserwowalność
IAM i bezpieczeństwo danych
Opanuj Data Engineering na następną rozmowę
Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.
Zacznij za darmo