Data Science & ML

Árboles de Decisión y Ensembles

Decision Trees, Random Forest, Gradient Boosting, XGBoost, ajuste de hiperparámetros, feature importance

24 preguntas de entrevista·
Mid-Level
1

¿Qué es un decision tree en Machine Learning?

Respuesta

Un decision tree es un modelo de Machine Learning que realiza predicciones dividiendo los datos según reglas de decisión jerárquicas. Cada nodo interno representa una prueba sobre una feature, cada rama representa el resultado de la prueba, y cada hoja representa una predicción final. Este modelo es intuitivo y fácilmente interpretable, lo que lo convierte en una excelente opción para entender los factores que influyen en una decisión.

2

¿Qué criterio se usa por defecto en scikit-learn para medir la calidad de un split en un árbol de clasificación?

Respuesta

El índice de Gini es el criterio por defecto en scikit-learn para árboles de clasificación. Mide la impureza de un nodo calculando la probabilidad de que un elemento sea clasificado erróneamente si se clasifica aleatoriamente según la distribución de clases. Un Gini de 0 significa un nodo puro (una sola clase), mientras que un Gini más alto indica mayor diversidad de clases.

3

¿Cuál es la principal diferencia entre el índice de Gini y la entropía como criterios de split?

Respuesta

El índice de Gini y la entropía generalmente producen árboles muy similares, pero Gini es ligeramente más rápido de calcular ya que no requiere cálculos logarítmicos. La entropía, basada en la teoría de la información, a veces puede crear splits ligeramente más equilibrados. En la práctica, la elección entre ambos raramente tiene un impacto significativo en el rendimiento del modelo.

4

¿Qué es el pruning en el contexto de los decision trees?

5

¿Qué hiperparámetro controla la profundidad máxima de un decision tree en scikit-learn?

+21 preguntas de entrevista

Domina Data Science & ML para tu próxima entrevista

Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.

Empieza gratis