Data Science & ML

Pandas avançado

GroupBy, merge, concat, pivot tables, time series, apply/transform, MultiIndex, desempenho

24 perguntas de entrevista·
Mid-Level
1

Qual método permite aplicar várias funções de agregação diferentes a uma única coluna com groupby?

Resposta

O método agg() (ou aggregate()) permite aplicar várias funções de agregação às mesmas colunas. Você pode passar uma lista de funções como ['sum', 'mean', 'count'] ou um dicionário para especificar funções diferentes por coluna. Essa flexibilidade é essencial para criar relatórios estatísticos completos em uma única operação.

2

Como nomear explicitamente as colunas resultantes durante uma agregação com groupby usando a sintaxe de named aggregation?

Resposta

A sintaxe named aggregation usa agg() com tuplas nomeadas via keyword arguments. Por exemplo: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')). Essa abordagem produz nomes de colunas explícitos e legíveis, evitando MultiIndex em colunas que podem complicar processamentos posteriores.

3

Qual é a principal diferença entre transform() e apply() em um contexto groupby?

Resposta

transform() retorna um resultado do mesmo tamanho que a entrada, alinhado ao índice original, ideal para adicionar estatísticas de grupo a cada linha (ex.: média do grupo). apply() é mais flexível e pode retornar um resultado de tamanho diferente, mas geralmente é mais lento. Use transform() para operações como normalização por grupo ou cálculo de z-scores.

4

Como filtrar grupos em um groupby para manter apenas aqueles que satisfazem uma condição (por exemplo, grupos com mais de 10 elementos)?

5

Qual é a diferença entre pd.merge() com how='left' e how='inner'?

+21 perguntas de entrevista

Domine Data Science & ML para sua proxima entrevista

Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.

Comece gratis