Data Science & ML

Data Science & ML

DATA

āļŦāļĨāļąāļāļŠāļđāļ•āļĢ Data Science āđāļĨāļ° Machine Learning āļ—āļĩāđˆāļ„āļĢāļ­āļšāļ„āļĨāļļāļĄāļ”āđ‰āļ§āļĒ Python āđ€āļ›āđ‡āļ™āļ āļēāļĐāļēāļŦāļĨāļąāļ āļ•āļąāđ‰āļ‡āđāļ•āđˆāļāļēāļĢāļˆāļąāļ”āļāļēāļĢāļ‚āđ‰āļ­āļĄāļđāļĨāļ”āđ‰āļ§āļĒ Pandas āđāļĨāļ° NumPy āđ„āļ›āļˆāļ™āļ–āļķāļ‡āļāļēāļĢāļŠāļĢāđ‰āļēāļ‡āđ‚āļĄāđ€āļ”āļĨ Deep Learning āļ”āđ‰āļ§āļĒ TensorFlow/Keras āļœāđˆāļēāļ™ ML āļ„āļĨāļēāļŠāļŠāļīāļāļ”āđ‰āļ§āļĒ Scikit-Learn āļĢāļ§āļĄāļ–āļķāļ‡āļ—āļąāļāļĐāļ° MLOps āđ€āļžāļ·āđˆāļ­ deploy āđāļĨāļ°āļ”āļđāđāļĨāļĢāļąāļāļĐāļēāđ‚āļĄāđ€āļ”āļĨāđƒāļ™ production āļ”āđ‰āļ§āļĒ Docker, FastAPI āđāļĨāļ°āđāļžāļĨāļ•āļŸāļ­āļĢāđŒāļĄ cloud

āļŠāļīāđˆāļ‡āļ—āļĩāđˆāļ„āļļāļ“āļˆāļ°āđ„āļ”āđ‰āđ€āļĢāļĩāļĒāļ™āļĢāļđāđ‰

Python āļŠāļĄāļąāļĒāđƒāļŦāļĄāđˆ āļžāļĢāđ‰āļ­āļĄāļāļēāļĢāđ€āļ‚āļĩāļĒāļ™āđ‚āļ›āļĢāđāļāļĢāļĄāđ€āļŠāļīāļ‡āļ§āļąāļ•āļ–āļļāđāļĨāļ°āđāļ™āļ§āļ›āļāļīāļšāļąāļ•āļīāļ—āļĩāđˆāļ”āļĩ

āļāļēāļĢāļˆāļąāļ”āļāļēāļĢāļ‚āđ‰āļ­āļĄāļđāļĨāļ”āđ‰āļ§āļĒ Pandas, NumPy āđāļĨāļ° SQL (BigQuery)

āļāļēāļĢāđāļŠāļ”āļ‡āļœāļĨāļ”āđ‰āļ§āļĒ Matplotlib, Seaborn āđāļĨāļ° Plotly

āļŠāļ–āļīāļ•āļīāđ€āļŠāļīāļ‡āļžāļĢāļĢāļ“āļ™āļēāđāļĨāļ°āđ€āļŠāļīāļ‡āļ­āļ™āļļāļĄāļēāļ™āļ”āđ‰āļ§āļĒ Statsmodel

Machine Learning āļ”āđ‰āļ§āļĒ Scikit-Learn āđāļĨāļ° XGBoost (āļāļēāļĢāļ–āļ”āļ–āļ­āļĒ, āļāļēāļĢāļˆāļģāđāļ™āļ, āļāļēāļĢāļˆāļąāļ”āļāļĨāļļāđˆāļĄ)

Deep Learning āļ”āđ‰āļ§āļĒ TensorFlow āđāļĨāļ° Keras (CNN, RNN, Transformer)

NLP āđāļĨāļ° GenAI āļ”āđ‰āļ§āļĒ Hugging Face, LangChain āđāļĨāļ° LLM (GPT, Gemini)

MLOps āļ”āđ‰āļ§āļĒ MLflow, Docker, FastAPI āđāļĨāļ° Streamlit

āļŠāļ āļēāļžāđāļ§āļ”āļĨāđ‰āļ­āļĄāļāļēāļĢāļžāļąāļ’āļ™āļē: Jupyter, Google Colab

āļāļēāļĢ deploy āļšāļ™ cloud āļ”āđ‰āļ§āļĒ Google Compute, Cloud Storage āđāļĨāļ° GPU

āļŦāļąāļ§āļ‚āđ‰āļ­āļŠāļģāļ„āļąāļāļ—āļĩāđˆāļ•āđ‰āļ­āļ‡āđ€āļŠāļĩāđˆāļĒāļ§āļŠāļēāļ

āđāļ™āļ§āļ„āļīāļ”āļ—āļĩāđˆāļŠāļģāļ„āļąāļāļ—āļĩāđˆāļŠāļļāļ”āđ€āļžāļ·āđˆāļ­āđ€āļ‚āđ‰āļēāđƒāļˆāđ€āļ—āļ„āđ‚āļ™āđ‚āļĨāļĒāļĩāļ™āļĩāđ‰āđāļĨāļ°āļ›āļĢāļ°āļŠāļšāļ„āļ§āļēāļĄāļŠāļģāđ€āļĢāđ‡āļˆāđƒāļ™āļāļēāļĢāļŠāļąāļĄāļ āļēāļĐāļ“āđŒ

1

Python: āļ›āļĢāļ°āđ€āļ āļ—, āđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ, OOP, decorator, generator, context manager

2

NumPy: āļ­āļēāļĢāđŒāđ€āļĢāļĒāđŒ, broadcasting, indexing, āļāļēāļĢāļ”āļģāđ€āļ™āļīāļ™āļāļēāļĢāđāļšāļš vector, āļžāļĩāļŠāļ„āļ“āļīāļ•āđ€āļŠāļīāļ‡āđ€āļŠāđ‰āļ™

3

Pandas: DataFrame, Series, indexing, groupby, merge, pivot, āļ­āļ™āļļāļāļĢāļĄāđ€āļ§āļĨāļē

4

SQL: SELECT, JOIN, GROUP BY, window function, CTE, āļāļēāļĢāđ€āļžāļīāđˆāļĄāļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļ„āļīāļ§āļĢāļĩ

5

āļāļēāļĢāđāļŠāļ”āļ‡āļœāļĨ: Matplotlib (figure, axes, subplot), Seaborn (āđāļœāļ™āļ āļđāļĄāļīāļŠāļ–āļīāļ•āļī), Plotly (āđāļšāļšāđ‚āļ•āđ‰āļ•āļ­āļš)

6

āļŠāļ–āļīāļ•āļī: āļāļēāļĢāđāļˆāļāđāļˆāļ‡, āļāļēāļĢāļ—āļ”āļŠāļ­āļšāļŠāļĄāļĄāļ•āļīāļāļēāļ™, āļŠāđˆāļ§āļ‡āļ„āļ§āļēāļĄāđ€āļŠāļ·āđˆāļ­āļĄāļąāđˆāļ™, āļāļēāļĢāļ–āļ”āļ–āļ­āļĒ

7

Feature Engineering: āļāļēāļĢāđ€āļ‚āđ‰āļēāļĢāļŦāļąāļŠ, āļāļēāļĢāļ›āļĢāļąāļšāļŠāđ€āļāļĨ, āļāļēāļĢāđ€āļĨāļ·āļ­āļāļŸāļĩāđ€āļˆāļ­āļĢāđŒ, āļāļēāļĢāļŠāļĢāđ‰āļēāļ‡āļŸāļĩāđ€āļˆāļ­āļĢāđŒ

8

ML āđāļšāļšāļĄāļĩāļœāļđāđ‰āļ”āļđāđāļĨ: āļāļēāļĢāļ–āļ”āļ–āļ­āļĒāđ€āļŠāļīāļ‡āđ€āļŠāđ‰āļ™/āđ‚āļĨāļˆāļīāļŠāļ•āļīāļ, āļ•āđ‰āļ™āđ„āļĄāđ‰, Random Forest, XGBoost, āđ€āļĄāļ•āļĢāļīāļ

9

ML āđāļšāļšāđ„āļĄāđˆāļĄāļĩāļœāļđāđ‰āļ”āļđāđāļĨ: K-Means, āļāļēāļĢāļˆāļąāļ”āļāļĨāļļāđˆāļĄāđāļšāļšāļĨāļģāļ”āļąāļšāļŠāļąāđ‰āļ™, PCA, t-SNE

10

ML Pipeline: āļāļēāļĢāđāļšāđˆāļ‡ train/test, cross-validation, āļāļēāļĢāļ›āļĢāļąāļš hyperparameter, overfitting

11

Deep Learning: perceptron, backpropagation, āļŸāļąāļ‡āļāđŒāļŠāļąāļ™āļāļĢāļ°āļ•āļļāđ‰āļ™, optimizer, āļŸāļąāļ‡āļāđŒāļŠāļąāļ™āļŠāļđāļāđ€āļŠāļĩāļĒ

12

CNN: convolution, pooling, āļŠāļ–āļēāļ›āļąāļ•āļĒāļāļĢāļĢāļĄ (ResNet, VGG), transfer learning

13

RNN/LSTM: āļĨāļģāļ”āļąāļš, vanishing gradient, āļāļĨāđ„āļ attention, Transformer

14

NLP: tokenization, embedding, word2vec, BERT, āļāļēāļĢ fine-tune LLM

15

MLOps: āļāļēāļĢāļˆāļąāļ”āļāļēāļĢāđ€āļ§āļ­āļĢāđŒāļŠāļąāļ™ (MLflow), āļāļēāļĢāļ—āļģ container (Docker), API (FastAPI), āļāļēāļĢāļ•āļīāļ”āļ•āļēāļĄ

16

Cloud: Google Cloud (Compute, Storage, BigQuery), āļāļēāļĢāđ€āļ—āļĢāļ™āļ”āđ‰āļ§āļĒ GPU, Vertex AI

17

āļˆāļĢāļīāļĒāļ˜āļĢāļĢāļĄ AI: āļ­āļ„āļ•āļī, āļ„āļ§āļēāļĄāļŠāļēāļĄāļēāļĢāļ–āđƒāļ™āļāļēāļĢāļ­āļ˜āļīāļšāļēāļĒ (SHAP, LIME), āļ„āļ§āļēāļĄāđ€āļ›āđ‡āļ™āļ˜āļĢāļĢāļĄ, GDPR

āļšāļ—āļ„āļ§āļēāļĄ Data Science & ML āļĨāđˆāļēāļŠāļļāļ”

āļ„āđ‰āļ™āļžāļšāļšāļ—āļ„āļ§āļēāļĄāđāļĨāļ°āļ„āļđāđˆāļĄāļ·āļ­āļĨāđˆāļēāļŠāļļāļ”āđ€āļāļĩāđˆāļĒāļ§āļāļąāļš Data Science & ML

Feature engineering āļŠāļģāļŦāļĢāļąāļš machine learning: āļāļēāļĢāđāļŠāļ”āļ‡āļ āļēāļž pipeline āļāļēāļĢāđāļ›āļĨāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ

Feature Engineering āļŠāļģāļŦāļĢāļąāļš Machine Learning: āđ€āļ—āļ„āļ™āļīāļ„āđāļĨāļ°āļ„āļģāļ–āļēāļĄāļŠāļąāļĄāļ āļēāļĐāļ“āđŒ 2026

āđ€āļĢāļĩāļĒāļ™āļĢāļđāđ‰āđ€āļ—āļ„āļ™āļīāļ„ feature engineering āļŠāļģāļŦāļĢāļąāļš machine learning āļžāļĢāđ‰āļ­āļĄāļ•āļąāļ§āļ­āļĒāđˆāļēāļ‡ Python āļˆāļĢāļīāļ‡ āļ„āļĢāļ­āļšāļ„āļĨāļļāļĄ encoding, scaling, āļāļēāļĢāļ„āļąāļ”āđ€āļĨāļ·āļ­āļ feature, pipeline scikit-learn āđāļĨāļ°āļ„āļģāļ–āļēāļĄāļŠāļąāļĄāļ āļēāļĐāļ“āđŒ data science

āđ€āļ›āļĢāļĩāļĒāļšāđ€āļ—āļĩāļĒāļš deep learning framework PyTorch vs TensorFlow 2026

PyTorch vs TensorFlow 2026: āļ„āļ§āļĢāđ€āļĨāļ·āļ­āļ Deep Learning Framework āļ•āļąāļ§āđ„āļŦāļ™āļ”āļĩ?

āđ€āļ›āļĢāļĩāļĒāļšāđ€āļ—āļĩāļĒāļš PyTorch vs TensorFlow āđƒāļ™āļ›āļĩ 2026 āļ„āļĢāļ­āļšāļ„āļĨāļļāļĄāļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļž āļāļēāļĢ deploy āļĢāļ°āļšāļšāļ™āļīāđ€āļ§āļĻ āđāļĨāļ°āļ›āļĢāļ°āļŠāļšāļāļēāļĢāļ“āđŒāļ™āļąāļāļžāļąāļ’āļ™āļē āđ€āļžāļ·āđˆāļ­āļŠāđˆāļ§āļĒāđ€āļĨāļ·āļ­āļ deep learning framework āļ—āļĩāđˆāđ€āļŦāļĄāļēāļ°āļŠāļĄ

āļšāļ—āđ€āļĢāļĩāļĒāļ™ Data Science āļ”āđ‰āļ§āļĒ Python āļžāļĢāđ‰āļ­āļĄ NumPy Pandas āđāļĨāļ° Scikit-Learn āļ āļēāļžāļ›āļĢāļ°āļāļ­āļšāđ‚āļ„āđ‰āļ”āđāļĨāļ°āđāļ”āļŠāļšāļ­āļĢāđŒāļ”

Python āļŠāļģāļŦāļĢāļąāļš Data Science: NumPy, Pandas āđāļĨāļ° Scikit-Learn āđƒāļ™āļ›āļĩ 2026

āļšāļ—āđ€āļĢāļĩāļĒāļ™āđ€āļŠāļīāļ‡āļ›āļāļīāļšāļąāļ•āļīāļ„āļĢāļ­āļšāļ„āļĨāļļāļĄ NumPy array operations, Pandas data manipulation āđāļĨāļ° Scikit-Learn model training āļŠāļĢāđ‰āļēāļ‡ data pipeline āļ„āļĢāļšāļ§āļ‡āļˆāļĢāļ•āļąāđ‰āļ‡āđāļ•āđˆāđ„āļŸāļĨāđŒ CSV āļ”āļīāļšāļˆāļ™āļ–āļķāļ‡āđ‚āļĄāđ€āļ”āļĨāļ—āļĩāđˆāļžāļĢāđ‰āļ­āļĄāđƒāļŠāđ‰āļ‡āļēāļ™āļˆāļĢāļīāļ‡āļ”āđ‰āļ§āļĒāđ‚āļ„āđ‰āļ” Python

āļ”āļđāļšāļ—āļ„āļ§āļēāļĄ Data Science & ML āļ—āļąāđ‰āļ‡āļŦāļĄāļ”