1
Python: kiểu, cấu trúc dữ liệu, OOP, decorator, generator, context manager
2
NumPy: mảng, broadcasting, indexing, phép toán vector hóa, đại số tuyến tính
3
Pandas: DataFrame, Series, indexing, groupby, merge, pivot, chuỗi thời gian
4
SQL: SELECT, JOIN, GROUP BY, window function, CTE, tối ưu truy vấn
5
Trực quan hóa: Matplotlib (figure, axes, subplot), Seaborn (biểu đồ thống kê), Plotly (tương tác)
6
Thống kê: phân phối, kiểm định giả thuyết, khoảng tin cậy, hồi quy
7
Feature Engineering: mã hóa, chuẩn hóa, chọn đặc trưng, tạo đặc trưng
8
ML có giám sát: hồi quy tuyến tính/logistic, cây, Random Forest, XGBoost, chỉ số
9
ML không giám sát: K-Means, gom cụm phân cấp, PCA, t-SNE
10
ML Pipeline: chia train/test, cross-validation, điều chỉnh siêu tham số, overfitting
11
Deep Learning: perceptron, lan truyền ngược, hàm kích hoạt, optimizer, hàm mất mát
12
CNN: tích chập, pooling, kiến trúc (ResNet, VGG), transfer learning
13
RNN/LSTM: chuỗi, gradient biến mất, cơ chế attention, Transformer
14
NLP: tokenization, embedding, word2vec, BERT, fine-tuning LLM
15
MLOps: quản lý phiên bản (MLflow), container hóa (Docker), API (FastAPI), giám sát
16
Cloud: Google Cloud (Compute, Storage, BigQuery), huấn luyện GPU, Vertex AI
17
Đạo đức AI: thiên kiến, khả năng giải thích (SHAP, LIME), công bằng, GDPR