Data Science & ML

Data Science & ML

DATA

Kompleksowy program Data Science i Machine Learning z Python jako głównym językiem. Od manipulacji danymi z Pandas i NumPy po implementację modeli Deep Learning z TensorFlow/Keras, przez klasyczne ML z Scikit-Learn. Obejmuje również umiejętności MLOps do wdrażania i utrzymywania modeli w produkcji z Docker, FastAPI i platformami chmury.

Czego się nauczysz

Nowoczesny Python z programowaniem obiektowym i najlepszymi praktykami

Manipulacja danymi z Pandas, NumPy i SQL (BigQuery)

Wizualizacja z Matplotlib, Seaborn i Plotly

Statystyka opisowa i wnioskowa z Statsmodel

Machine Learning z Scikit-Learn i XGBoost (regresja, klasyfikacja, klasteryzacja)

Deep Learning z TensorFlow i Keras (CNN, RNN, Transformers)

NLP i GenAI z Hugging Face, LangChain i LLM (GPT, Gemini)

MLOps z MLflow, Docker, FastAPI i Streamlit

Środowiska deweloperskie: Jupyter, Google Colab

Wdrażanie w chmurze z Google Compute, Cloud Storage i GPU

Kluczowe tematy do opanowania

Najważniejsze pojęcia do zrozumienia tej technologii i zdania rozmów

1

Python: typy, struktury danych, OOP, dekoratory, generatory, menedżery kontekstu

2

NumPy: tablice, broadcasting, indeksowanie, operacje wektoryzowane, algebra liniowa

3

Pandas: DataFrame, Series, indeksowanie, groupby, merge, pivot, serie czasowe

4

SQL: SELECT, JOIN, GROUP BY, funkcje okna, CTE, optymalizacja zapytań

5

Wizualizacja: Matplotlib (figure, axes, subplot), Seaborn (wykresy statystyczne), Plotly (interaktywne)

6

Statystyka: rozkłady, testy hipotez, przedziały ufności, regresja

7

Feature Engineering: kodowanie, skalowanie, selekcja cech, tworzenie cech

8

ML nadzorowane: regresja liniowa/logistyczna, drzewa, Random Forest, XGBoost, metryki

9

ML nienadzorowane: K-Means, klasteryzacja hierarchiczna, PCA, t-SNE

10

Pipeline ML: podział train/test, walidacja krzyżowa, strojenie hiperparametrów, overfitting

11

Deep Learning: perceptrony, propagacja wsteczna, funkcje aktywacji, optymalizatory, funkcje straty

12

CNN: konwolucje, pooling, architektury (ResNet, VGG), transfer learning

13

RNN/LSTM: sekwencje, zanikający gradient, mechanizm uwagi, Transformery

14

NLP: tokenizacja, embeddingi, word2vec, BERT, fine-tuning LLM

15

MLOps: wersjonowanie (MLflow), konteneryzacja (Docker), API (FastAPI), monitorowanie

16

Chmura: Google Cloud (Compute, Storage, BigQuery), trenowanie GPU, Vertex AI

17

Etyka AI: stronniczość, wyjaśnialność (SHAP, LIME), sprawiedliwość, RODO