Data Engineering

IAM และความปลอดภัยของข้อมูล

สิทธิ์น้อยที่สุด, service accounts, บทบาท GCP, การเข้ารหัส at rest/in transit, data masking, audit logs, การปฏิบัติตาม GDPR, VPC Service Controls

20 คำถามสัมภาษณ์·
Senior
1

หลักการพื้นฐานที่ควรใช้เมื่อกำหนดสิทธิ์ IAM ใน GCP คืออะไร?

คำตอบ

หลักการสิทธิ์น้อยที่สุด (least privilege) หมายถึงการให้สิทธิ์เฉพาะที่จำเป็นอย่างเคร่งครัดในการทำงานเท่านั้น ใน Data Engineering หมายความว่า pipeline ควรเข้าถึงเฉพาะ bucket, dataset และ table ที่จำเป็นจริงๆ เท่านั้น หลักการนี้ลดพื้นผิวการโจมตีและจำกัดความเสียหายที่อาจเกิดขึ้นหาก service account ถูกบุกรุก

2

ความแตกต่างระหว่าง service account และบัญชีผู้ใช้ใน GCP คืออะไร?

คำตอบ

Service account คือตัวตนที่ออกแบบสำหรับแอปพลิเคชันและบริการ ในขณะที่บัญชีผู้ใช้แทนบุคคล Service account ยืนยันตัวตนโดยใช้คีย์ JSON หรือ Workload Identity ไม่มีรหัสผ่าน และออกแบบมาสำหรับการทำงานอัตโนมัติ ใน Data Engineering แต่ละ pipeline ควรมี service account ของตัวเองพร้อมสิทธิ์เฉพาะ

3

ลำดับชั้นของบทบาท IAM ใน GCP จากที่มีสิทธิ์น้อยที่สุดไปยังมากที่สุดคืออะไร?

คำตอบ

ลำดับชั้นของบทบาท IAM เริ่มจาก Viewer (อ่านอย่างเดียว) ไปยัง Editor (อ่าน/เขียนโดยไม่จัดการ IAM) ไปยัง Owner (ควบคุมเต็มรวมถึง IAM และการเรียกเก็บเงิน) สำหรับ pipeline ข้อมูล แนะนำให้ใช้บทบาทที่กำหนดล่วงหน้าที่ละเอียดเช่น BigQuery Data Viewer หรือ Storage Object Creator แทนบทบาทดั้งเดิมที่กว้างเกินไปเหล่านี้

4

ทำไมจึงควรหลีกเลี่ยงคีย์ service account แบบ JSON ในสภาพแวดล้อมการผลิต GCP?

5

ความแตกต่างระหว่างการเข้ารหัส at rest และการเข้ารหัส in transit คืออะไร?

+17 คำถามสัมภาษณ์

หัวข้อสัมภาษณ์ Data Engineering อื่นๆ

Linux & Shell - พื้นฐาน

Junior
20 คำถาม

Git & GitHub - พื้นฐาน

Junior
20 คำถาม

Python ขั้นสูงสำหรับ Data Engineering

Junior
25 คำถาม

Docker - พื้นฐาน

Junior
25 คำถาม

Google Cloud Platform - พื้นฐาน

Junior
20 คำถาม

CI/CD และคุณภาพโค้ด

Mid-Level
20 คำถาม

Docker Compose

Mid-Level
20 คำถาม

FastAPI - Data API

Mid-Level
20 คำถาม

SQL ขั้นสูงสำหรับ Data Engineering

Mid-Level
20 คำถาม

Data Lake - สถาปัตยกรรมและการนำเข้าข้อมูล

Mid-Level
20 คำถาม

BigQuery สำหรับ Data Engineering

Mid-Level
20 คำถาม

PostgreSQL - การดูแลระบบ

Mid-Level
20 คำถาม

Data Modeling สำหรับ Data Engineering

Mid-Level
20 คำถาม

Fivetran & Airbyte - การนำเข้าข้อมูล

Mid-Level
20 คำถาม

dbt - พื้นฐาน

Mid-Level
20 คำถาม

Apache Airflow - พื้นฐาน

Mid-Level
20 คำถาม

Kubernetes - พื้นฐาน

Mid-Level
20 คำถาม

dbt - ฟีเจอร์ขั้นสูง

Senior
20 คำถาม

รูปแบบ ETL / ELT / ETLT

Senior
20 คำถาม

Apache Airflow - ขั้นสูง

Senior
20 คำถาม

Airflow + dbt - การจัดการ Pipeline

Senior
20 คำถาม

PySpark - การประมวลผลขนาดใหญ่

Senior
20 คำถาม

Google Pub/Sub - การสตรีมข้อมูล

Senior
20 คำถาม

Apache Beam & Dataflow

Senior
20 คำถาม

Kubernetes - Production และ Scaling

Senior
20 คำถาม

Terraform - Infrastructure as Code

Senior
20 คำถาม

ฐานข้อมูล NoSQL

Senior
20 คำถาม

Data Architecture สมัยใหม่

Senior
20 คำถาม

การมอนิเตอร์และการสังเกตการณ์

Senior
20 คำถาม

เชี่ยวชาญ Data Engineering สำหรับการสัมภาษณ์ครั้งถัดไป

เข้าถึงคำถามทั้งหมด flashcards แบบทดสอบเทคนิค แบบฝึกหัด code review และตัวจำลองสัมภาษณ์

เริ่มใช้ฟรี