
Árvores de Decisão e Ensembles
Decision Trees, Random Forest, Gradient Boosting, XGBoost, ajuste de hiperparâmetros, feature importance
1O que é uma decision tree em Machine Learning?
O que é uma decision tree em Machine Learning?
Resposta
Uma decision tree é um modelo de Machine Learning que faz previsões dividindo os dados conforme regras de decisão hierárquicas. Cada nó interno representa um teste sobre uma feature, cada ramo representa o resultado do teste, e cada folha representa uma previsão final. Esse modelo é intuitivo e facilmente interpretável, sendo uma excelente escolha para entender os fatores que influenciam uma decisão.
2Qual critério é usado por padrão no scikit-learn para medir a qualidade de um split em uma classification tree?
Qual critério é usado por padrão no scikit-learn para medir a qualidade de um split em uma classification tree?
Resposta
O índice de Gini é o critério padrão no scikit-learn para classification trees. Ele mede a impureza de um nó calculando a probabilidade de um elemento ser classificado incorretamente se for classificado aleatoriamente conforme a distribuição de classes. Um Gini de 0 significa um nó puro (uma única classe), enquanto um Gini mais alto indica maior diversidade de classes.
3Qual é a principal diferença entre o índice de Gini e a entropia como critérios de split?
Qual é a principal diferença entre o índice de Gini e a entropia como critérios de split?
Resposta
O índice de Gini e a entropia geralmente produzem árvores muito similares, mas o Gini é ligeiramente mais rápido de calcular pois não requer cálculos logarítmicos. A entropia, baseada na teoria da informação, pode às vezes criar splits ligeiramente mais equilibrados. Na prática, a escolha entre os dois raramente tem um impacto significativo no desempenho do modelo.
O que é pruning no contexto das decision trees?
Qual hiperparâmetro controla a profundidade máxima de uma decision tree no scikit-learn?
+21 perguntas de entrevista
Outros temas de entrevista Data Science & ML
Fundamentos de Python
Programação Orientada a Objetos em Python
Estruturas de dados em Python
Fundamentos do Git
Fundamentos de SQL
Fundamentos de NumPy
Fundamentos de Pandas
Jupyter & Google Colab
SQL Joins e consultas avançadas
Pandas avançado
Visualização com Matplotlib & Seaborn
Visualizações interativas com Plotly
Estatística descritiva
Estatística inferencial
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML Supervisionado: Regressão
ML Supervisionado: Classificação
ML Não Supervisionado
Pipelines ML e Validação
Séries Temporais e Previsão
Fundamentos de Deep Learning
TensorFlow & Keras
CNN e classificação de imagens
RNN e Sequências
Transformers e Attention
NLP e Hugging Face
GenAI e LangChain
MLOps e Implantação
Domine Data Science & ML para sua proxima entrevista
Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.
Comece gratis