Data Science & ML

Data Science & ML

DATA

Programa completo de Data Science e Machine Learning com Python como linguagem principal. Da manipulação de dados com Pandas e NumPy à implementação de modelos de Deep Learning com TensorFlow/Keras, passando pelo ML clássico com Scikit-Learn. Inclui também habilidades de MLOps para implantar e manter modelos em produção com Docker, FastAPI e plataformas em nuvem.

O que voce vai aprender

Python moderno com programação orientada a objetos e boas práticas

Manipulação de dados com Pandas, NumPy e SQL (BigQuery)

Visualização com Matplotlib, Seaborn e Plotly

Estatística descritiva e inferencial com Statsmodel

Machine Learning com Scikit-Learn e XGBoost (regressão, classificação, clustering)

Deep Learning com TensorFlow e Keras (CNN, RNN, Transformers)

NLP e GenAI com Hugging Face, LangChain e LLMs (GPT, Gemini)

MLOps com MLflow, Docker, FastAPI e Streamlit

Ambientes de desenvolvimento: Jupyter, Google Colab

Deploy em nuvem com Google Compute, Cloud Storage e GPU

Topicos-chave para dominar

Os conceitos mais importantes para entender esta tecnologia e mandar bem nas entrevistas

1

Python: tipos, estruturas de dados, POO, decorators, generators, context managers

2

NumPy: arrays, broadcasting, indexing, operações vetorizadas, álgebra linear

3

Pandas: DataFrames, Series, indexing, groupby, merge, pivot, séries temporais

4

SQL: SELECT, JOIN, GROUP BY, window functions, CTEs, otimização de consultas

5

Visualização: Matplotlib (figures, axes, subplots), Seaborn (gráficos estatísticos), Plotly (interativo)

6

Estatística: distribuições, testes de hipótese, intervalos de confiança, regressão

7

Feature Engineering: encoding, scaling, seleção de features, criação de features

8

ML Supervisionado: regressão linear/logística, árvores, Random Forest, XGBoost, métricas

9

ML Não Supervisionado: K-Means, clustering hierárquico, PCA, t-SNE

10

Pipeline de ML: train/test split, cross-validation, hyperparameter tuning, overfitting

11

Deep Learning: perceptrons, backpropagation, funções de ativação, otimizadores, funções de perda

12

CNN: convoluções, pooling, arquiteturas (ResNet, VGG), transfer learning

13

RNN/LSTM: sequências, vanishing gradient, mecanismo de atenção, Transformers

14

NLP: tokenization, embeddings, word2vec, BERT, fine-tuning de LLM

15

MLOps: versionamento (MLflow), containerização (Docker), API (FastAPI), monitoramento

16

Cloud: Google Cloud (Compute, Storage, BigQuery), treinamento com GPU, Vertex AI

17

Ética em IA: viés, explicabilidade (SHAP, LIME), equidade, LGPD/GDPR