Data Science & ML

Estadística descriptiva

Media, mediana, desviación estándar, cuartiles, distribuciones, correlaciones, outliers, skewness

20 preguntas de entrevista·
Mid-Level
1

¿Qué medida de tendencia central es más apropiada para datos que contienen valores extremos (outliers)?

Respuesta

La mediana es la medida de tendencia central más robusta frente a outliers porque representa el valor central de los datos ordenados, sin verse afectada por valores extremos. A diferencia de la media que suma todos los valores, la mediana solo considera la posición. Por ejemplo, para los salarios de una empresa con algunos ejecutivos muy bien pagados, la mediana da una mejor representación del salario típico que la media.

2

¿Qué es la varianza de un conjunto de datos?

Respuesta

La varianza mide la dispersión de los datos alrededor de su media. Se calcula como el promedio de los cuadrados de las desviaciones respecto a la media. Al elevar al cuadrado, se obtienen valores siempre positivos y se amplifica el impacto de los valores alejados de la media. La unidad de la varianza es el cuadrado de la unidad original de los datos, por lo que a menudo se usa la desviación estándar (raíz cuadrada de la varianza) para interpretar la dispersión en la unidad original.

3

¿Cuál es la relación entre la desviación estándar y la varianza?

Respuesta

La desviación estándar es la raíz cuadrada de la varianza. Esta transformación devuelve la medida de dispersión a la unidad original de los datos, facilitando la interpretación. Por ejemplo, si los datos están en euros, la varianza estará en euros cuadrados (difícil de interpretar), mientras que la desviación estándar estará en euros. Por lo tanto, se prefiere la desviación estándar para comunicar la dispersión de los datos de manera intuitiva.

4

¿Qué representa el primer cuartil (Q1) de una distribución?

5

¿Cómo interpretar un coeficiente de correlación de Pearson igual a -0.85?

+17 preguntas de entrevista

Domina Data Science & ML para tu próxima entrevista

Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.

Empieza gratis