Data Science & ML

Pandas avanzado

GroupBy, merge, concat, pivot tables, time series, apply/transform, MultiIndex, rendimiento

24 preguntas de entrevista·
Mid-Level
1

¿Qué método permite aplicar varias funciones de agregación diferentes a una sola columna con groupby?

Respuesta

El método agg() (o aggregate()) permite aplicar múltiples funciones de agregación a las mismas columnas. Puedes pasar una lista de funciones como ['sum', 'mean', 'count'] o un diccionario para especificar funciones diferentes por columna. Esta flexibilidad es esencial para crear informes estadísticos completos en una sola operación.

2

¿Cómo nombrar explícitamente las columnas resultantes durante una agregación con groupby usando la sintaxis de named aggregation?

Respuesta

La sintaxis named aggregation usa agg() con tuplas nombradas mediante keyword arguments. Por ejemplo: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')). Este enfoque produce nombres de columnas explícitos y legibles, evitando MultiIndex en columnas que pueden complicar procesamientos posteriores.

3

¿Cuál es la principal diferencia entre transform() y apply() en un contexto groupby?

Respuesta

transform() devuelve un resultado del mismo tamaño que la entrada, alineado al índice original, ideal para agregar estadísticas de grupo a cada fila (ej.: media del grupo). apply() es más flexible y puede devolver un resultado de tamaño diferente, pero generalmente es más lento. Usa transform() para operaciones como normalización por grupo o cálculo de z-scores.

4

¿Cómo filtrar grupos en un groupby para conservar solo aquellos que satisfacen una condición (por ejemplo, grupos con más de 10 elementos)?

5

¿Cuál es la diferencia entre pd.merge() con how='left' y how='inner'?

+21 preguntas de entrevista

Domina Data Science & ML para tu próxima entrevista

Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.

Empieza gratis