Data Science & ML

Data Science & ML

DATA

Umfassendes Data-Science- und Machine-Learning-Curriculum mit Python als Hauptsprache. Von der Datenmanipulation mit Pandas und NumPy bis zur Implementierung von Deep-Learning-Modellen mit TensorFlow/Keras, über klassisches ML mit Scikit-Learn. Beinhaltet auch MLOps-Fähigkeiten zum Deployen und Warten von Modellen in Produktion mit Docker, FastAPI und Cloud-Plattformen.

Was du lernen wirst

Modernes Python mit objektorientierter Programmierung und Best Practices

Datenmanipulation mit Pandas, NumPy und SQL (BigQuery)

Visualisierung mit Matplotlib, Seaborn und Plotly

Deskriptive und inferenzielle Statistik mit Statsmodel

Machine Learning mit Scikit-Learn und XGBoost (Regression, Klassifikation, Clustering)

Deep Learning mit TensorFlow und Keras (CNN, RNN, Transformers)

NLP und GenAI mit Hugging Face, LangChain und LLMs (GPT, Gemini)

MLOps mit MLflow, Docker, FastAPI und Streamlit

Entwicklungsumgebungen: Jupyter, Google Colab

Cloud-Deployment mit Google Compute, Cloud Storage und GPU

Schlüsselthemen zum Meistern

Die wichtigsten Konzepte, um diese Technologie zu verstehen und deine Interviews zu bestehen

1

Python: Typen, Datenstrukturen, OOP, Decorators, Generators, Context Managers

2

NumPy: Arrays, Broadcasting, Indexing, vektorisierte Operationen, lineare Algebra

3

Pandas: DataFrames, Series, Indexing, groupby, merge, pivot, Zeitreihen

4

SQL: SELECT, JOIN, GROUP BY, Window Functions, CTEs, Abfrageoptimierung

5

Visualisierung: Matplotlib (Figures, Axes, Subplots), Seaborn (statistische Plots), Plotly (interaktiv)

6

Statistik: Verteilungen, Hypothesentests, Konfidenzintervalle, Regression

7

Feature Engineering: Encoding, Skalierung, Feature-Auswahl, Feature-Erstellung

8

Überwachtes ML: Lineare/logistische Regression, Bäume, Random Forest, XGBoost, Metriken

9

Unüberwachtes ML: K-Means, hierarchisches Clustering, PCA, t-SNE

10

ML-Pipeline: Train/Test Split, Cross-Validation, Hyperparameter-Tuning, Overfitting

11

Deep Learning: Perzeptronen, Backpropagation, Aktivierungsfunktionen, Optimizer, Verlustfunktionen

12

CNN: Faltungen, Pooling, Architekturen (ResNet, VGG), Transfer Learning

13

RNN/LSTM: Sequenzen, Vanishing Gradient, Attention-Mechanismus, Transformers

14

NLP: Tokenisierung, Embeddings, word2vec, BERT, LLM-Feinabstimmung

15

MLOps: Versionierung (MLflow), Containerisierung (Docker), API (FastAPI), Monitoring

16

Cloud: Google Cloud (Compute, Storage, BigQuery), GPU-Training, Vertex AI

17

KI-Ethik: Bias, Erklärbarkeit (SHAP, LIME), Fairness, DSGVO