Data Science & ML

DATA

Programa completo de Data Science e Machine Learning com Python como linguagem principal. Da manipulação de dados com Pandas e NumPy à implementação de modelos de Deep Learning com TensorFlow/Keras, passando pelo ML clássico com Scikit-Learn. Inclui também habilidades de MLOps para implantar e manter modelos em produção com Docker, FastAPI e plataformas em nuvem.

O que voce vai aprender

Python moderno com programação orientada a objetos e boas práticas

Manipulação de dados com Pandas, NumPy e SQL (BigQuery)

Visualização com Matplotlib, Seaborn e Plotly

Estatística descritiva e inferencial com Statsmodel

Machine Learning com Scikit-Learn e XGBoost (regressão, classificação, clustering)

Deep Learning com TensorFlow e Keras (CNN, RNN, Transformers)

NLP e GenAI com Hugging Face, LangChain e LLMs (GPT, Gemini)

MLOps com MLflow, Docker, FastAPI e Streamlit

Ambientes de desenvolvimento: Jupyter, Google Colab

Deploy em nuvem com Google Compute, Cloud Storage e GPU

Topicos-chave para dominar

Os conceitos mais importantes para entender esta tecnologia e mandar bem nas entrevistas

Python: tipos, estruturas de dados, POO, decorators, generators, context managers

NumPy: arrays, broadcasting, indexing, operações vetorizadas, álgebra linear

Pandas: DataFrames, Series, indexing, groupby, merge, pivot, séries temporais

SQL: SELECT, JOIN, GROUP BY, window functions, CTEs, otimização de consultas

Visualização: Matplotlib (figures, axes, subplots), Seaborn (gráficos estatísticos), Plotly (interativo)

Estatística: distribuições, testes de hipótese, intervalos de confiança, regressão

Feature Engineering: encoding, scaling, seleção de features, criação de features

ML Supervisionado: regressão linear/logística, árvores, Random Forest, XGBoost, métricas

ML Não Supervisionado: K-Means, clustering hierárquico, PCA, t-SNE

Pipeline de ML: train/test split, cross-validation, hyperparameter tuning, overfitting

Deep Learning: perceptrons, backpropagation, funções de ativação, otimizadores, funções de perda

CNN: convoluções, pooling, arquiteturas (ResNet, VGG), transfer learning

RNN/LSTM: sequências, vanishing gradient, mecanismo de atenção, Transformers

NLP: tokenization, embeddings, word2vec, BERT, fine-tuning de LLM

MLOps: versionamento (MLflow), containerização (Docker), API (FastAPI), monitoramento

Cloud: Google Cloud (Compute, Storage, BigQuery), treinamento com GPU, Vertex AI

Ética em IA: viés, explicabilidade (SHAP, LIME), equidade, LGPD/GDPR

Artigos recentes sobre Data Science & ML

Descubra nossos ultimos artigos e guias sobre Data Science & ML

June 6, 2026

RAG e LLMs em 2026: Retrieval-Augmented Generation para Entrevistas de Data Science

Domine RAG interview questions e retrieval augmented generation para entrevistas de data science em 2026. Guia completo com código e melhores práticas.

Tutorial de fine-tuning de NLP com Hugging Face Transformers 2026

May 19, 2026

Hugging Face Transformers em 2026: NLP, fine-tuning e perguntas de entrevista

Tutorial de Hugging Face Transformers cobrindo a API v5, o fine-tuning com LoRA, os pipelines de NLP e as perguntas de entrevista mais frequentes para vagas de data science em 2026.

Feature engineering para machine learning: visualizacao do pipeline de transformacao de dados

May 8, 2026

Feature Engineering para Machine Learning: Tecnicas e Perguntas de Entrevista 2026

Guia completo de feature engineering para entrevistas de data science em 2026. Encoding categorico, scaling, selecao de features, pipelines de producao e perguntas frequentes.

Ver todos os artigos de Data Science & ML