1
Python: tipos, estruturas de dados, POO, decorators, generators, context managers
2
NumPy: arrays, broadcasting, indexing, operações vetorizadas, álgebra linear
3
Pandas: DataFrames, Series, indexing, groupby, merge, pivot, séries temporais
4
SQL: SELECT, JOIN, GROUP BY, window functions, CTEs, otimização de consultas
5
Visualização: Matplotlib (figures, axes, subplots), Seaborn (gráficos estatísticos), Plotly (interativo)
6
Estatística: distribuições, testes de hipótese, intervalos de confiança, regressão
7
Feature Engineering: encoding, scaling, seleção de features, criação de features
8
ML Supervisionado: regressão linear/logística, árvores, Random Forest, XGBoost, métricas
9
ML Não Supervisionado: K-Means, clustering hierárquico, PCA, t-SNE
10
Pipeline de ML: train/test split, cross-validation, hyperparameter tuning, overfitting
11
Deep Learning: perceptrons, backpropagation, funções de ativação, otimizadores, funções de perda
12
CNN: convoluções, pooling, arquiteturas (ResNet, VGG), transfer learning
13
RNN/LSTM: sequências, vanishing gradient, mecanismo de atenção, Transformers
14
NLP: tokenization, embeddings, word2vec, BERT, fine-tuning de LLM
15
MLOps: versionamento (MLflow), containerização (Docker), API (FastAPI), monitoramento
16
Cloud: Google Cloud (Compute, Storage, BigQuery), treinamento com GPU, Vertex AI
17
Ética em IA: viés, explicabilidade (SHAP, LIME), equidade, LGPD/GDPR