
IAM và Bảo mật Dữ liệu
Đặc quyền tối thiểu, service accounts, vai trò GCP, mã hóa at rest/in transit, data masking, audit logs, tuân thủ GDPR, VPC Service Controls
1Nguyên tắc cơ bản nào cần áp dụng khi gán quyền IAM trong GCP?
Nguyên tắc cơ bản nào cần áp dụng khi gán quyền IAM trong GCP?
Câu trả lời
Nguyên tắc đặc quyền tối thiểu (least privilege) có nghĩa là chỉ cấp các quyền thực sự cần thiết để hoàn thành một nhiệm vụ. Trong Data Engineering, điều này có nghĩa là pipeline chỉ nên có quyền truy cập vào các bucket, dataset và table mà nó thực sự cần. Nguyên tắc này giảm bề mặt tấn công và hạn chế thiệt hại tiềm tàng nếu một service account bị xâm phạm.
2Sự khác biệt giữa service account và tài khoản người dùng trong GCP là gì?
Sự khác biệt giữa service account và tài khoản người dùng trong GCP là gì?
Câu trả lời
Service account là một danh tính được thiết kế cho ứng dụng và dịch vụ, trong khi tài khoản người dùng đại diện cho một người. Service account xác thực bằng khóa JSON hoặc Workload Identity, không có mật khẩu và được thiết kế cho tự động hóa. Trong Data Engineering, mỗi pipeline nên có service account riêng với quyền cụ thể.
3Hệ thống phân cấp vai trò IAM trong GCP, từ ít quyền nhất đến nhiều quyền nhất, là gì?
Hệ thống phân cấp vai trò IAM trong GCP, từ ít quyền nhất đến nhiều quyền nhất, là gì?
Câu trả lời
Hệ thống phân cấp vai trò IAM đi từ Viewer (chỉ đọc) đến Editor (đọc/ghi không quản lý IAM) đến Owner (kiểm soát đầy đủ bao gồm IAM và thanh toán). Đối với pipeline dữ liệu, nên sử dụng các vai trò định nghĩa trước có độ chi tiết cao như BigQuery Data Viewer hoặc Storage Object Creator thay vì các vai trò nguyên thủy quá rộng này.
Tại sao nên tránh sử dụng khóa JSON service account trong môi trường sản xuất GCP?
Sự khác biệt giữa mã hóa at rest và mã hóa in transit là gì?
+17 câu hỏi phỏng vấn
Các chủ đề phỏng vấn Data Engineering khác
Linux & Shell - Cơ bản
Git & GitHub - Kiến thức cơ bản
Python nâng cao cho Data Engineering
Docker - Cơ bản
Google Cloud Platform - Cơ bản
CI/CD và chất lượng mã
Docker Compose
FastAPI - API dữ liệu
SQL nâng cao cho Data Engineering
Data Lake - Kiến trúc và nạp dữ liệu
BigQuery cho Data Engineering
PostgreSQL - Quản trị
Data Modeling cho Data Engineering
Fivetran & Airbyte - Nạp dữ liệu
dbt - Kiến thức cơ bản
Apache Airflow - Cơ bản
Kubernetes - Cơ Bản
dbt - Tính năng nâng cao
Mẫu ETL / ELT / ETLT
Apache Airflow - Nâng cao
Airflow + dbt - Điều phối pipeline
PySpark - Xử lý quy mô lớn
Google Pub/Sub - Streaming dữ liệu
Apache Beam & Dataflow
Kubernetes - Production và Scaling
Terraform - Infrastructure as Code
Cơ sở dữ liệu NoSQL
Data Architecture hiện đại
Giám sát và Khả năng quan sát
Nắm vững Data Engineering cho lần phỏng vấn tiếp theo
Truy cập tất cả câu hỏi, flashcards, bài kiểm tra kỹ thuật, bài tập code review và mô phỏng phỏng vấn.
Bắt đầu miễn phí