Data Science & ML

RNN e Sequências

RNN, LSTM, GRU, vanishing gradient, séries temporais, previsões, sequence-to-sequence

22 perguntas de entrevista·
Senior
1

Qual é a característica principal que distingue uma RNN de uma rede neural feedforward clássica?

Resposta

Uma RNN possui conexões recorrentes que mantêm um hidden state que evolui ao longo do tempo. Esse hidden state atua como uma memória que captura informações das entradas anteriores da sequência. Diferente das redes feedforward, onde cada entrada é processada independentemente, as RNN podem modelar dependências temporais entre os elementos de uma sequência.

2

Como o hidden state h_t é calculado em uma RNN simples (vanilla RNN) em cada time step?

Resposta

Em uma vanilla RNN, o hidden state h_t é calculado aplicando uma função de ativação (geralmente tanh) à combinação linear da entrada atual x_t ponderada por W_xh e o hidden state anterior h_{t-1} ponderado por W_hh, mais um bias. Essa fórmula permite à rede combinar a nova informação com a memória dos time steps anteriores.

3

Qual é o principal problema do vanishing gradient nas RNN e quando ele ocorre?

Resposta

O vanishing gradient ocorre durante a backpropagation through time (BPTT) quando os gradientes são multiplicados muitas vezes por valores menores que 1. Em sequências longas, esses gradientes se tornam exponencialmente pequenos, impedindo a rede de aprender dependências de longo prazo. Os pesos das primeiras camadas temporais quase não são atualizados.

4

Quais são os três gates (portas) que compõem uma célula LSTM e qual é o papel respectivo de cada um?

5

Como o LSTM resolve o problema do vanishing gradient em comparação com a vanilla RNN?

+19 perguntas de entrevista

Domine Data Science & ML para sua proxima entrevista

Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.

Comece gratis