Data Science & ML

Data Science & ML

DATA

Percorso completo in Data Science e Machine Learning con Python come linguaggio principale. Dalla manipolazione dati con Pandas e NumPy all'implementazione di modelli Deep Learning con TensorFlow/Keras, passando per ML classico con Scikit-Learn. Include anche competenze MLOps per distribuire e mantenere modelli in produzione con Docker, FastAPI e piattaforme cloud.

Cosa imparerai

Python moderno con programmazione orientata agli oggetti e best practice

Manipolazione dati con Pandas, NumPy e SQL (BigQuery)

Visualizzazione con Matplotlib, Seaborn e Plotly

Statistica descrittiva e inferenziale con Statsmodel

Machine Learning con Scikit-Learn e XGBoost (regressione, classificazione, clustering)

Deep Learning con TensorFlow e Keras (CNN, RNN, Transformer)

NLP e GenAI con Hugging Face, LangChain e LLM (GPT, Gemini)

MLOps con MLflow, Docker, FastAPI e Streamlit

Ambienti di sviluppo: Jupyter, Google Colab

Distribuzione cloud con Google Compute, Cloud Storage e GPU

Argomenti chiave da padroneggiare

I concetti più importanti per comprendere questa tecnologia e superare i colloqui

1

Python: tipi, strutture dati, OOP, decorator, generator, context manager

2

NumPy: array, broadcasting, indicizzazione, operazioni vettorizzate, algebra lineare

3

Pandas: DataFrame, Series, indicizzazione, groupby, merge, pivot, serie temporali

4

SQL: SELECT, JOIN, GROUP BY, window function, CTE, ottimizzazione query

5

Visualizzazione: Matplotlib (figure, axes, subplot), Seaborn (grafici statistici), Plotly (interattivi)

6

Statistica: distribuzioni, test d'ipotesi, intervalli di confidenza, regressione

7

Feature Engineering: encoding, scaling, selezione feature, creazione feature

8

ML supervisionato: regressione lineare/logistica, alberi, Random Forest, XGBoost, metriche

9

ML non supervisionato: K-Means, clustering gerarchico, PCA, t-SNE

10

ML Pipeline: split train/test, cross-validation, tuning iperparametri, overfitting

11

Deep Learning: perceptron, backpropagation, funzioni di attivazione, ottimizzatori, funzioni di perdita

12

CNN: convoluzioni, pooling, architetture (ResNet, VGG), transfer learning

13

RNN/LSTM: sequenze, vanishing gradient, meccanismo di attenzione, Transformer

14

NLP: tokenizzazione, embedding, word2vec, BERT, fine-tuning LLM

15

MLOps: versionamento (MLflow), containerizzazione (Docker), API (FastAPI), monitoraggio

16

Cloud: Google Cloud (Compute, Storage, BigQuery), training GPU, Vertex AI

17

Etica AI: bias, spiegabilità (SHAP, LIME), equità, GDPR