Data Science & ML

Árvores de Decisão e Ensembles

Decision Trees, Random Forest, Gradient Boosting, XGBoost, ajuste de hiperparâmetros, feature importance

24 perguntas de entrevista·
Mid-Level
1

O que é uma decision tree em Machine Learning?

Resposta

Uma decision tree é um modelo de Machine Learning que faz previsões dividindo os dados conforme regras de decisão hierárquicas. Cada nó interno representa um teste sobre uma feature, cada ramo representa o resultado do teste, e cada folha representa uma previsão final. Esse modelo é intuitivo e facilmente interpretável, sendo uma excelente escolha para entender os fatores que influenciam uma decisão.

2

Qual critério é usado por padrão no scikit-learn para medir a qualidade de um split em uma classification tree?

Resposta

O índice de Gini é o critério padrão no scikit-learn para classification trees. Ele mede a impureza de um nó calculando a probabilidade de um elemento ser classificado incorretamente se for classificado aleatoriamente conforme a distribuição de classes. Um Gini de 0 significa um nó puro (uma única classe), enquanto um Gini mais alto indica maior diversidade de classes.

3

Qual é a principal diferença entre o índice de Gini e a entropia como critérios de split?

Resposta

O índice de Gini e a entropia geralmente produzem árvores muito similares, mas o Gini é ligeiramente mais rápido de calcular pois não requer cálculos logarítmicos. A entropia, baseada na teoria da informação, pode às vezes criar splits ligeiramente mais equilibrados. Na prática, a escolha entre os dois raramente tem um impacto significativo no desempenho do modelo.

4

O que é pruning no contexto das decision trees?

5

Qual hiperparâmetro controla a profundidade máxima de uma decision tree no scikit-learn?

+21 perguntas de entrevista

Domine Data Science & ML para sua proxima entrevista

Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.

Comece gratis