1
Linux và Shell: lệnh cơ bản, bash scripting, quyền, cron job
2
Git và GitHub: nhánh, merge, rebase, pull request, quy trình CI/CD
3
Python nâng cao: OOP, decorator, generator, context manager, typing, async/await
4
CI/CD: linting (Ruff, Pylint), đóng gói (Poetry), test, GitHub Actions, pipeline
5
Docker: Dockerfile, image, container, volume, network, multi-stage build
6
Docker Compose: dịch vụ đa container, phụ thuộc, healthcheck, điều phối cục bộ
7
FastAPI: route, model Pydantic, dependency, middleware, triển khai
8
SQL nâng cao: window function, CTE, truy vấn phân tích, tối ưu hóa, index
9
BigQuery: kiến trúc serverless, phân vùng, gom cụm, chi phí, UDF, truy vấn liên hợp
10
PostgreSQL: cấu hình, nhân bản, index (B-tree, GIN, GiST), VACUUM, EXPLAIN ANALYZE
11
Mô hình hóa dữ liệu: lược đồ hình sao, bảng fact/dimension, chuẩn hóa, SCD, data vault
12
ELT vs ETL vs ETLT: mẫu, đánh đổi, lựa chọn kiến trúc
13
Fivetran và Airbyte: connector, chế độ đồng bộ, CDC, tiến hóa schema
14
dbt: model, source, ref, test, snapshot, model tăng dần, Jinja macro
15
Apache Airflow: DAG, operator, sensor, XCom, connection, pool, phụ thuộc tác vụ
16
PySpark: RDD vs DataFrame, chuyển đổi, action, phân vùng, biến broadcast
17
Streaming: Pub/Sub (topic, subscription), Apache Beam (PCollection, transform, windowing), Dataflow
18
Kubernetes: pod, deployment, service, ingress, ConfigMap, Secret, Helm, mở rộng
19
Terraform: provider, resource, state, module, plan/apply, infrastructure as code
20
IAM và bảo mật: nguyên tắc quyền tối thiểu, service account, vai trò GCP
21
Cơ sở dữ liệu NoSQL: GraphDB (Neo4j), Document DB (MongoDB, Firestore), Wide Column (Cassandra, Bigtable)
22
Kiến trúc dữ liệu: Data Lake vs Data Warehouse vs Data Lakehouse, Data Mesh, Data Contract
23
Giám sát và khả năng quan sát: ghi log, chỉ số, cảnh báo, SLA/SLO/SLI, kiểm tra chất lượng dữ liệu