1
Python : types, structures de données, POO, décorateurs, générateurs, context managers
2
NumPy : arrays, broadcasting, indexation, opérations vectorisées, algèbre linéaire
3
Pandas : DataFrames, Series, indexation, groupby, merge, pivot, time series
4
SQL : SELECT, JOIN, GROUP BY, window functions, CTEs, optimisation de requêtes
5
Visualisation : Matplotlib (figures, axes, subplots), Seaborn (statistical plots), Plotly (interactif)
6
Statistiques : distributions, tests d'hypothèse, intervalles de confiance, régression
7
Feature Engineering : encoding, scaling, feature selection, feature creation
8
ML Supervised : régression linéaire/logistique, arbres, Random Forest, XGBoost, métriques
9
ML Unsupervised : K-Means, clustering hiérarchique, PCA, t-SNE
10
Pipeline ML : train/test split, cross-validation, hyperparameter tuning, overfitting
11
Deep Learning : perceptrons, backpropagation, activation functions, optimizers, loss functions
12
CNN : convolutions, pooling, architectures (ResNet, VGG), transfer learning
13
RNN/LSTM : séquences, vanishing gradient, attention mechanism, Transformers
14
NLP : tokenization, embeddings, word2vec, BERT, fine-tuning LLMs
15
MLOps : versioning (MLflow), containerisation (Docker), API (FastAPI), monitoring
16
Cloud : Google Cloud (Compute, Storage, BigQuery), GPU training, Vertex AI
17
Éthique IA : biais, explicabilité (SHAP, LIME), fairness, RGPD