
Pandas avançado
GroupBy, merge, concat, pivot tables, time series, apply/transform, MultiIndex, desempenho
1Qual método permite aplicar várias funções de agregação diferentes a uma única coluna com groupby?
Qual método permite aplicar várias funções de agregação diferentes a uma única coluna com groupby?
Resposta
O método agg() (ou aggregate()) permite aplicar várias funções de agregação às mesmas colunas. Você pode passar uma lista de funções como ['sum', 'mean', 'count'] ou um dicionário para especificar funções diferentes por coluna. Essa flexibilidade é essencial para criar relatórios estatísticos completos em uma única operação.
2Como nomear explicitamente as colunas resultantes durante uma agregação com groupby usando a sintaxe de named aggregation?
Como nomear explicitamente as colunas resultantes durante uma agregação com groupby usando a sintaxe de named aggregation?
Resposta
A sintaxe named aggregation usa agg() com tuplas nomeadas via keyword arguments. Por exemplo: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')). Essa abordagem produz nomes de colunas explícitos e legíveis, evitando MultiIndex em colunas que podem complicar processamentos posteriores.
3Qual é a principal diferença entre transform() e apply() em um contexto groupby?
Qual é a principal diferença entre transform() e apply() em um contexto groupby?
Resposta
transform() retorna um resultado do mesmo tamanho que a entrada, alinhado ao índice original, ideal para adicionar estatísticas de grupo a cada linha (ex.: média do grupo). apply() é mais flexível e pode retornar um resultado de tamanho diferente, mas geralmente é mais lento. Use transform() para operações como normalização por grupo ou cálculo de z-scores.
Como filtrar grupos em um groupby para manter apenas aqueles que satisfazem uma condição (por exemplo, grupos com mais de 10 elementos)?
Qual é a diferença entre pd.merge() com how='left' e how='inner'?
+21 perguntas de entrevista
Outros temas de entrevista Data Science & ML
Fundamentos de Python
Programação Orientada a Objetos em Python
Estruturas de dados em Python
Fundamentos do Git
Fundamentos de SQL
Fundamentos de NumPy
Fundamentos de Pandas
Jupyter & Google Colab
SQL Joins e consultas avançadas
Visualização com Matplotlib & Seaborn
Visualizações interativas com Plotly
Estatística descritiva
Estatística inferencial
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML Supervisionado: Regressão
ML Supervisionado: Classificação
Árvores de Decisão e Ensembles
ML Não Supervisionado
Pipelines ML e Validação
Séries Temporais e Previsão
Fundamentos de Deep Learning
TensorFlow & Keras
CNN e classificação de imagens
RNN e Sequências
Transformers e Attention
NLP e Hugging Face
GenAI e LangChain
MLOps e Implantação
Domine Data Science & ML para sua proxima entrevista
Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.
Comece gratis