Data Science & ML

Data Science & ML

DATA

Programa completo de Data Science y Machine Learning con Python como lenguaje principal. Desde la manipulación de datos con Pandas y NumPy hasta la implementación de modelos de Deep Learning con TensorFlow/Keras, pasando por ML clásico con Scikit-Learn. También incluye habilidades de MLOps para desplegar y mantener modelos en producción con Docker, FastAPI y plataformas cloud.

Lo que aprenderás

Python moderno con programación orientada a objetos y buenas prácticas

Manipulación de datos con Pandas, NumPy y SQL (BigQuery)

Visualización con Matplotlib, Seaborn y Plotly

Estadística descriptiva e inferencial con Statsmodel

Machine Learning con Scikit-Learn y XGBoost (regresión, clasificación, clustering)

Deep Learning con TensorFlow y Keras (CNN, RNN, Transformers)

NLP y GenAI con Hugging Face, LangChain y LLMs (GPT, Gemini)

MLOps con MLflow, Docker, FastAPI y Streamlit

Entornos de desarrollo: Jupyter, Google Colab

Despliegue en la nube con Google Compute, Cloud Storage y GPU

Temas clave a dominar

Los conceptos más importantes para entender esta tecnología y aprobar tus entrevistas

1

Python: tipos, estructuras de datos, POO, decoradores, generadores, context managers

2

NumPy: arrays, broadcasting, indexación, operaciones vectorizadas, álgebra lineal

3

Pandas: DataFrames, Series, indexación, groupby, merge, pivot, series temporales

4

SQL: SELECT, JOIN, GROUP BY, window functions, CTEs, optimización de consultas

5

Visualización: Matplotlib (figures, axes, subplots), Seaborn (gráficos estadísticos), Plotly (interactivo)

6

Estadística: distribuciones, pruebas de hipótesis, intervalos de confianza, regresión

7

Feature Engineering: encoding, scaling, selección de features, creación de features

8

ML supervisado: regresión lineal/logística, árboles, Random Forest, XGBoost, métricas

9

ML no supervisado: K-Means, clustering jerárquico, PCA, t-SNE

10

Pipeline ML: train/test split, cross-validation, ajuste de hiperparámetros, overfitting

11

Deep Learning: perceptrones, backpropagation, funciones de activación, optimizers, funciones de pérdida

12

CNN: convoluciones, pooling, arquitecturas (ResNet, VGG), transfer learning

13

RNN/LSTM: secuencias, vanishing gradient, mecanismo de atención, Transformers

14

NLP: tokenización, embeddings, word2vec, BERT, fine-tuning de LLMs

15

MLOps: versionado (MLflow), contenedorización (Docker), API (FastAPI), monitoreo

16

Cloud: Google Cloud (Compute, Storage, BigQuery), entrenamiento con GPU, Vertex AI

17

Ética en IA: sesgo, explicabilidad (SHAP, LIME), equidad, GDPR