Question 1

คุณลักษณะทางสถาปัตยกรรมหลักของ Google Pub/Sub คืออะไร?

Accepted Answer

Google Pub/Sub เป็นบริการส่งข้อความแบบอะซิงโครนัสไร้เซิร์ฟเวอร์ที่แยกผู้ผลิตข้อความออกจากผู้บริโภค Publisher ส่งข้อความไปยัง topic โดยไม่รู้จัก subscriber และ subscriber รับข้อความผ่าน subscription โดยไม่รู้จัก publisher สถาปัตยกรรมนี้ช่วยให้สามารถปรับขนาดในแนวนอนได้อย่างอิสระทั้งสองด้าน

Question 2

อะไรคือความแตกต่างพื้นฐานระหว่าง topic และ subscription ใน Pub/Sub?

Accepted Answer

Topic คือช่องที่มีชื่อซึ่ง publisher ส่งข้อความไป ในขณะที่ subscription คือเอนทิตีที่มีชื่อซึ่งแสดงถึงความสนใจของ subscriber ในการรับข้อความจาก topic หนึ่ง topic สามารถมีหลาย subscription และแต่ละ subscription จะได้รับสำเนาของทุกข้อความที่ส่งไปยัง topic

Question 3

ในกรณีใดควรเลือก pull subscription แทน push subscription?

Accepted Answer

Pull subscription จะดีกว่าเมื่อ subscriber ต้องการควบคุมอัตราการบริโภคข้อความ (flow control), ประมวลผล batch ขนาดใหญ่ หรือเมื่อสภาพแวดล้อมการทำงานไม่สามารถเปิดเผย HTTPS endpoint สาธารณะได้ Pull ยังช่วยให้จัดการกับ load spike ได้ง่ายขึ้นโดยการปรับจำนวนข้อความที่ดึงมาแบบไดนามิก

Google Pub/Sub - การสตรีมข้อมูล

คุณลักษณะทางสถาปัตยกรรมหลักของ Google Pub/Sub คืออะไร?

คำตอบ

อะไรคือความแตกต่างพื้นฐานระหว่าง topic และ subscription ใน Pub/Sub?

คำตอบ

ในกรณีใดควรเลือก pull subscription แทน push subscription?

คำตอบ

กลไก acknowledgement ทำงานอย่างไรใน Pub/Sub?

บทบาทของ dead letter topic ใน Pub/Sub คืออะไร?

หัวข้อสัมภาษณ์ Data Engineering อื่นๆ

Linux & Shell - พื้นฐาน

Git & GitHub - พื้นฐาน

Python ขั้นสูงสำหรับ Data Engineering

Docker - พื้นฐาน

Google Cloud Platform - พื้นฐาน

CI/CD และคุณภาพโค้ด

Docker Compose

FastAPI - Data API

SQL ขั้นสูงสำหรับ Data Engineering

Data Lake - สถาปัตยกรรมและการนำเข้าข้อมูล

BigQuery สำหรับ Data Engineering

PostgreSQL - การดูแลระบบ

Data Modeling สำหรับ Data Engineering

Fivetran & Airbyte - การนำเข้าข้อมูล

dbt - พื้นฐาน

Apache Airflow - พื้นฐาน

Kubernetes - พื้นฐาน

dbt - ฟีเจอร์ขั้นสูง

รูปแบบ ETL / ELT / ETLT

Apache Airflow - ขั้นสูง

Airflow + dbt - การจัดการ Pipeline

PySpark - การประมวลผลขนาดใหญ่

Apache Beam & Dataflow

Kubernetes - Production และ Scaling

Terraform - Infrastructure as Code

ฐานข้อมูล NoSQL

Data Architecture สมัยใหม่

การมอนิเตอร์และการสังเกตการณ์

IAM และความปลอดภัยของข้อมูล

เชี่ยวชาญ Data Engineering สำหรับการสัมภาษณ์ครั้งถัดไป