Data Science & ML

Data Science & ML

DATA

Uitgebreid Data Science en Machine Learning-curriculum met Python als hoofdtaal. Van datamanipulatie met Pandas en NumPy tot het implementeren van Deep Learning-modellen met TensorFlow/Keras, via klassieke ML met Scikit-Learn. Omvat ook MLOps-vaardigheden om modellen in productie te deployen en te onderhouden met Docker, FastAPI en cloudplatformen.

Wat je zult leren

Modern Python met objectgeoriënteerd programmeren en best practices

Datamanipulatie met Pandas, NumPy en SQL (BigQuery)

Visualisatie met Matplotlib, Seaborn en Plotly

Beschrijvende en inferentiële statistiek met Statsmodel

Machine Learning met Scikit-Learn en XGBoost (regressie, classificatie, clustering)

Deep Learning met TensorFlow en Keras (CNN, RNN, Transformers)

NLP en GenAI met Hugging Face, LangChain en LLM's (GPT, Gemini)

MLOps met MLflow, Docker, FastAPI en Streamlit

Ontwikkelomgevingen: Jupyter, Google Colab

Cloud-deployment met Google Compute, Cloud Storage en GPU

Belangrijkste onderwerpen om te beheersen

De belangrijkste concepten om deze technologie te begrijpen en je gesprekken te halen

1

Python: typen, datastructuren, OOP, decorators, generators, context managers

2

NumPy: arrays, broadcasting, indexering, gevectoriseerde operaties, lineaire algebra

3

Pandas: DataFrames, Series, indexering, groupby, merge, pivot, tijdreeksen

4

SQL: SELECT, JOIN, GROUP BY, window functions, CTE's, query-optimalisatie

5

Visualisatie: Matplotlib (figures, axes, subplots), Seaborn (statistische plots), Plotly (interactief)

6

Statistiek: verdelingen, hypothesetesten, betrouwbaarheidsintervallen, regressie

7

Feature Engineering: encoding, schaling, feature-selectie, feature-creatie

8

Supervised ML: lineaire/logistische regressie, bomen, Random Forest, XGBoost, metrics

9

Unsupervised ML: K-Means, hiërarchische clustering, PCA, t-SNE

10

ML Pipeline: train/test-splitsing, kruisvalidatie, hyperparameter-tuning, overfitting

11

Deep Learning: perceptrons, backpropagatie, activatiefuncties, optimizers, verliesfuncties

12

CNN: convoluties, pooling, architecturen (ResNet, VGG), transfer learning

13

RNN/LSTM: sequenties, verdwijnende gradiënt, attentiemechanisme, Transformers

14

NLP: tokenisatie, embeddings, word2vec, BERT, LLM fine-tuning

15

MLOps: versioning (MLflow), containerisatie (Docker), API (FastAPI), monitoring

16

Cloud: Google Cloud (Compute, Storage, BigQuery), GPU-training, Vertex AI

17

AI-ethiek: bias, uitlegbaarheid (SHAP, LIME), eerlijkheid, AVG