Data Science & ML

Data Science & ML

DATA

Комплексна програма Data Science та Machine Learning з Python як основною мовою. Від маніпулювання даними з Pandas та NumPy до реалізації моделей Deep Learning з TensorFlow/Keras, через класичний ML з Scikit-Learn. Включає також навички MLOps для розгортання та підтримки моделей у продакшн з Docker, FastAPI та хмарними платформами.

Чому ти навчишся

Сучасний Python з об'єктно-орієнтованим програмуванням та кращими практиками

Маніпулювання даними з Pandas, NumPy та SQL (BigQuery)

Візуалізація з Matplotlib, Seaborn та Plotly

Описова та інференційна статистика з Statsmodel

Machine Learning з Scikit-Learn та XGBoost (регресія, класифікація, кластеризація)

Deep Learning з TensorFlow та Keras (CNN, RNN, Transformer)

NLP та GenAI з Hugging Face, LangChain та LLM (GPT, Gemini)

MLOps з MLflow, Docker, FastAPI та Streamlit

Середовища розробки: Jupyter, Google Colab

Хмарне розгортання з Google Compute, Cloud Storage та GPU

Ключові теми для опанування

Найважливіші концепції для розуміння цієї технології та проходження співбесід

1

Python: типи, структури даних, ООП, декоратори, генератори, контекстні менеджери

2

NumPy: масиви, broadcasting, індексування, векторизовані операції, лінійна алгебра

3

Pandas: DataFrame, Series, індексування, groupby, merge, pivot, часові ряди

4

SQL: SELECT, JOIN, GROUP BY, window function, CTE, оптимізація запитів

5

Візуалізація: Matplotlib (figure, axes, subplot), Seaborn (статистичні графіки), Plotly (інтерактивні)

6

Статистика: розподіли, перевірка гіпотез, довірчі інтервали, регресія

7

Feature Engineering: кодування, масштабування, відбір ознак, створення ознак

8

Керований ML: лінійна/логістична регресія, дерева, Random Forest, XGBoost, метрики

9

Некерований ML: K-Means, ієрархічна кластеризація, PCA, t-SNE

10

ML Pipeline: поділ train/test, крос-валідація, налаштування гіперпараметрів, перенавчання

11

Deep Learning: перцептрон, зворотне поширення, функції активації, оптимізатори, функції втрат

12

CNN: згортки, pooling, архітектури (ResNet, VGG), transfer learning

13

RNN/LSTM: послідовності, зникаючий градієнт, механізм уваги, Transformer

14

NLP: токенізація, embedding, word2vec, BERT, тонке налаштування LLM

15

MLOps: версіонування (MLflow), контейнеризація (Docker), API (FastAPI), моніторинг

16

Хмара: Google Cloud (Compute, Storage, BigQuery), тренування на GPU, Vertex AI

17

Етика AI: упередженість, пояснюваність (SHAP, LIME), справедливість, GDPR