
RNN e Sequências
RNN, LSTM, GRU, vanishing gradient, séries temporais, previsões, sequence-to-sequence
1Qual é a característica principal que distingue uma RNN de uma rede neural feedforward clássica?
Qual é a característica principal que distingue uma RNN de uma rede neural feedforward clássica?
Resposta
Uma RNN possui conexões recorrentes que mantêm um hidden state que evolui ao longo do tempo. Esse hidden state atua como uma memória que captura informações das entradas anteriores da sequência. Diferente das redes feedforward, onde cada entrada é processada independentemente, as RNN podem modelar dependências temporais entre os elementos de uma sequência.
2Como o hidden state h_t é calculado em uma RNN simples (vanilla RNN) em cada time step?
Como o hidden state h_t é calculado em uma RNN simples (vanilla RNN) em cada time step?
Resposta
Em uma vanilla RNN, o hidden state h_t é calculado aplicando uma função de ativação (geralmente tanh) à combinação linear da entrada atual x_t ponderada por W_xh e o hidden state anterior h_{t-1} ponderado por W_hh, mais um bias. Essa fórmula permite à rede combinar a nova informação com a memória dos time steps anteriores.
3Qual é o principal problema do vanishing gradient nas RNN e quando ele ocorre?
Qual é o principal problema do vanishing gradient nas RNN e quando ele ocorre?
Resposta
O vanishing gradient ocorre durante a backpropagation through time (BPTT) quando os gradientes são multiplicados muitas vezes por valores menores que 1. Em sequências longas, esses gradientes se tornam exponencialmente pequenos, impedindo a rede de aprender dependências de longo prazo. Os pesos das primeiras camadas temporais quase não são atualizados.
Quais são os três gates (portas) que compõem uma célula LSTM e qual é o papel respectivo de cada um?
Como o LSTM resolve o problema do vanishing gradient em comparação com a vanilla RNN?
+19 perguntas de entrevista
Outros temas de entrevista Data Science & ML
Fundamentos de Python
Programação Orientada a Objetos em Python
Estruturas de dados em Python
Fundamentos do Git
Fundamentos de SQL
Fundamentos de NumPy
Fundamentos de Pandas
Jupyter & Google Colab
SQL Joins e consultas avançadas
Pandas avançado
Visualização com Matplotlib & Seaborn
Visualizações interativas com Plotly
Estatística descritiva
Estatística inferencial
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML Supervisionado: Regressão
ML Supervisionado: Classificação
Árvores de Decisão e Ensembles
ML Não Supervisionado
Pipelines ML e Validação
Séries Temporais e Previsão
Fundamentos de Deep Learning
TensorFlow & Keras
CNN e classificação de imagens
Transformers e Attention
NLP e Hugging Face
GenAI e LangChain
MLOps e Implantação
Domine Data Science & ML para sua proxima entrevista
Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.
Comece gratis