
Estadística descriptiva
Media, mediana, desviación estándar, cuartiles, distribuciones, correlaciones, outliers, skewness
1¿Qué medida de tendencia central es más apropiada para datos que contienen valores extremos (outliers)?
¿Qué medida de tendencia central es más apropiada para datos que contienen valores extremos (outliers)?
Respuesta
La mediana es la medida de tendencia central más robusta frente a outliers porque representa el valor central de los datos ordenados, sin verse afectada por valores extremos. A diferencia de la media que suma todos los valores, la mediana solo considera la posición. Por ejemplo, para los salarios de una empresa con algunos ejecutivos muy bien pagados, la mediana da una mejor representación del salario típico que la media.
2¿Qué es la varianza de un conjunto de datos?
¿Qué es la varianza de un conjunto de datos?
Respuesta
La varianza mide la dispersión de los datos alrededor de su media. Se calcula como el promedio de los cuadrados de las desviaciones respecto a la media. Al elevar al cuadrado, se obtienen valores siempre positivos y se amplifica el impacto de los valores alejados de la media. La unidad de la varianza es el cuadrado de la unidad original de los datos, por lo que a menudo se usa la desviación estándar (raíz cuadrada de la varianza) para interpretar la dispersión en la unidad original.
3¿Cuál es la relación entre la desviación estándar y la varianza?
¿Cuál es la relación entre la desviación estándar y la varianza?
Respuesta
La desviación estándar es la raíz cuadrada de la varianza. Esta transformación devuelve la medida de dispersión a la unidad original de los datos, facilitando la interpretación. Por ejemplo, si los datos están en euros, la varianza estará en euros cuadrados (difícil de interpretar), mientras que la desviación estándar estará en euros. Por lo tanto, se prefiere la desviación estándar para comunicar la dispersión de los datos de manera intuitiva.
¿Qué representa el primer cuartil (Q1) de una distribución?
¿Cómo interpretar un coeficiente de correlación de Pearson igual a -0.85?
+17 preguntas de entrevista
Otros temas de entrevista Data Science & ML
Fundamentos de Python
Programación Orientada a Objetos en Python
Estructuras de datos en Python
Fundamentos de Git
Fundamentos de SQL
Fundamentos de NumPy
Fundamentos de Pandas
Jupyter & Google Colab
SQL Joins y consultas avanzadas
Pandas avanzado
Visualización con Matplotlib & Seaborn
Visualizaciones interactivas con Plotly
Estadística inferencial
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML Supervisado: Regresión
ML Supervisado: Clasificación
Árboles de Decisión y Ensembles
ML No Supervisado
Pipelines ML y Validación
Series Temporales y Pronóstico
Fundamentos de Deep Learning
TensorFlow & Keras
CNN y clasificación de imágenes
RNN y Secuencias
Transformers y Attention
NLP y Hugging Face
GenAI y LangChain
MLOps y Despliegue
Domina Data Science & ML para tu próxima entrevista
Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.
Empieza gratis