
Google Pub/Sub - การสตรีมข้อมูล
Topics, subscriptions, push vs pull, ordering, dead lettering, exactly-once delivery, monitoring, schema registry
1คุณลักษณะทางสถาปัตยกรรมหลักของ Google Pub/Sub คืออะไร?
คุณลักษณะทางสถาปัตยกรรมหลักของ Google Pub/Sub คืออะไร?
คำตอบ
Google Pub/Sub เป็นบริการส่งข้อความแบบอะซิงโครนัสไร้เซิร์ฟเวอร์ที่แยกผู้ผลิตข้อความออกจากผู้บริโภค Publisher ส่งข้อความไปยัง topic โดยไม่รู้จัก subscriber และ subscriber รับข้อความผ่าน subscription โดยไม่รู้จัก publisher สถาปัตยกรรมนี้ช่วยให้สามารถปรับขนาดในแนวนอนได้อย่างอิสระทั้งสองด้าน
2อะไรคือความแตกต่างพื้นฐานระหว่าง topic และ subscription ใน Pub/Sub?
อะไรคือความแตกต่างพื้นฐานระหว่าง topic และ subscription ใน Pub/Sub?
คำตอบ
Topic คือช่องที่มีชื่อซึ่ง publisher ส่งข้อความไป ในขณะที่ subscription คือเอนทิตีที่มีชื่อซึ่งแสดงถึงความสนใจของ subscriber ในการรับข้อความจาก topic หนึ่ง topic สามารถมีหลาย subscription และแต่ละ subscription จะได้รับสำเนาของทุกข้อความที่ส่งไปยัง topic
3ในกรณีใดควรเลือก pull subscription แทน push subscription?
ในกรณีใดควรเลือก pull subscription แทน push subscription?
คำตอบ
Pull subscription จะดีกว่าเมื่อ subscriber ต้องการควบคุมอัตราการบริโภคข้อความ (flow control), ประมวลผล batch ขนาดใหญ่ หรือเมื่อสภาพแวดล้อมการทำงานไม่สามารถเปิดเผย HTTPS endpoint สาธารณะได้ Pull ยังช่วยให้จัดการกับ load spike ได้ง่ายขึ้นโดยการปรับจำนวนข้อความที่ดึงมาแบบไดนามิก
กลไก acknowledgement ทำงานอย่างไรใน Pub/Sub?
บทบาทของ dead letter topic ใน Pub/Sub คืออะไร?
+17 คำถามสัมภาษณ์
หัวข้อสัมภาษณ์ Data Engineering อื่นๆ
Linux & Shell - พื้นฐาน
Git & GitHub - พื้นฐาน
Python ขั้นสูงสำหรับ Data Engineering
Docker - พื้นฐาน
Google Cloud Platform - พื้นฐาน
CI/CD และคุณภาพโค้ด
Docker Compose
FastAPI - Data API
SQL ขั้นสูงสำหรับ Data Engineering
Data Lake - สถาปัตยกรรมและการนำเข้าข้อมูล
BigQuery สำหรับ Data Engineering
PostgreSQL - การดูแลระบบ
Data Modeling สำหรับ Data Engineering
Fivetran & Airbyte - การนำเข้าข้อมูล
dbt - พื้นฐาน
Apache Airflow - พื้นฐาน
Kubernetes - พื้นฐาน
dbt - ฟีเจอร์ขั้นสูง
รูปแบบ ETL / ELT / ETLT
Apache Airflow - ขั้นสูง
Airflow + dbt - การจัดการ Pipeline
PySpark - การประมวลผลขนาดใหญ่
Apache Beam & Dataflow
Kubernetes - Production และ Scaling
Terraform - Infrastructure as Code
ฐานข้อมูล NoSQL
Data Architecture สมัยใหม่
การมอนิเตอร์และการสังเกตการณ์
IAM และความปลอดภัยของข้อมูล
เชี่ยวชาญ Data Engineering สำหรับการสัมภาษณ์ครั้งถัดไป
เข้าถึงคำถามทั้งหมด flashcards แบบทดสอบเทคนิค แบบฝึกหัด code review และตัวจำลองสัมภาษณ์
เริ่มใช้ฟรี