Data Science & ML

Data Science & ML

DATA

Parcours complet en Data Science et Machine Learning avec Python comme langage principal. De la manipulation de données avec Pandas et NumPy à l'implémentation de modèles de Deep Learning avec TensorFlow/Keras, en passant par le ML classique avec Scikit-Learn. Inclut également les compétences MLOps pour déployer et maintenir des modèles en production avec Docker, FastAPI et les plateformes cloud.

Ce que tu vas apprendre

Python moderne avec programmation orientée objet et bonnes pratiques

Manipulation de données avec Pandas, NumPy et SQL (BigQuery)

Visualisation avec Matplotlib, Seaborn et Plotly

Statistiques descriptives et inférentielles avec Statsmodel

Machine Learning avec Scikit-Learn et XGBoost (régression, classification, clustering)

Deep Learning avec TensorFlow et Keras (CNN, RNN, Transformers)

NLP et GenAI avec Hugging Face, LangChain et LLMs (GPT, Gemini)

MLOps avec MLflow, Docker, FastAPI et Streamlit

Environnements de développement : Jupyter, Google Colab

Déploiement cloud avec Google Compute, Cloud Storage et GPU

Sujets clés à maîtriser

Les concepts les plus importants pour comprendre cette techno et réussir tes entretiens

1

Python : types, structures de données, POO, décorateurs, générateurs, context managers

2

NumPy : arrays, broadcasting, indexation, opérations vectorisées, algèbre linéaire

3

Pandas : DataFrames, Series, indexation, groupby, merge, pivot, time series

4

SQL : SELECT, JOIN, GROUP BY, window functions, CTEs, optimisation de requêtes

5

Visualisation : Matplotlib (figures, axes, subplots), Seaborn (statistical plots), Plotly (interactif)

6

Statistiques : distributions, tests d'hypothèse, intervalles de confiance, régression

7

Feature Engineering : encoding, scaling, feature selection, feature creation

8

ML Supervised : régression linéaire/logistique, arbres, Random Forest, XGBoost, métriques

9

ML Unsupervised : K-Means, clustering hiérarchique, PCA, t-SNE

10

Pipeline ML : train/test split, cross-validation, hyperparameter tuning, overfitting

11

Deep Learning : perceptrons, backpropagation, activation functions, optimizers, loss functions

12

CNN : convolutions, pooling, architectures (ResNet, VGG), transfer learning

13

RNN/LSTM : séquences, vanishing gradient, attention mechanism, Transformers

14

NLP : tokenization, embeddings, word2vec, BERT, fine-tuning LLMs

15

MLOps : versioning (MLflow), containerisation (Docker), API (FastAPI), monitoring

16

Cloud : Google Cloud (Compute, Storage, BigQuery), GPU training, Vertex AI

17

Éthique IA : biais, explicabilité (SHAP, LIME), fairness, RGPD