Question 1

Qual é a característica principal que distingue uma RNN de uma rede neural feedforward clássica?

Accepted Answer

Uma RNN possui conexões recorrentes que mantêm um hidden state que evolui ao longo do tempo. Esse hidden state atua como uma memória que captura informações das entradas anteriores da sequência. Diferente das redes feedforward, onde cada entrada é processada independentemente, as RNN podem modelar dependências temporais entre os elementos de uma sequência.

Question 2

Como o hidden state h_t é calculado em uma RNN simples (vanilla RNN) em cada time step?

Accepted Answer

Em uma vanilla RNN, o hidden state h_t é calculado aplicando uma função de ativação (geralmente tanh) à combinação linear da entrada atual x_t ponderada por W_xh e o hidden state anterior h_{t-1} ponderado por W_hh, mais um bias. Essa fórmula permite à rede combinar a nova informação com a memória dos time steps anteriores.

Question 3

Qual é o principal problema do vanishing gradient nas RNN e quando ele ocorre?

Accepted Answer

O vanishing gradient ocorre durante a backpropagation through time (BPTT) quando os gradientes são multiplicados muitas vezes por valores menores que 1. Em sequências longas, esses gradientes se tornam exponencialmente pequenos, impedindo a rede de aprender dependências de longo prazo. Os pesos das primeiras camadas temporais quase não são atualizados.

RNN e Sequências

Qual é a característica principal que distingue uma RNN de uma rede neural feedforward clássica?

Resposta

Como o hidden state h_t é calculado em uma RNN simples (vanilla RNN) em cada time step?

Resposta

Qual é o principal problema do vanishing gradient nas RNN e quando ele ocorre?

Resposta

Quais são os três gates (portas) que compõem uma célula LSTM e qual é o papel respectivo de cada um?

Como o LSTM resolve o problema do vanishing gradient em comparação com a vanilla RNN?

Outros temas de entrevista Data Science & ML

Fundamentos de Python

Programação Orientada a Objetos em Python

Estruturas de dados em Python

Fundamentos do Git

Fundamentos de SQL

Fundamentos de NumPy

Fundamentos de Pandas

Jupyter & Google Colab

SQL Joins e consultas avançadas

Pandas avançado

Visualização com Matplotlib & Seaborn

Visualizações interativas com Plotly

Estatística descritiva

Estatística inferencial

Web Scraping

BigQuery & Cloud Data

Feature Engineering

ML Supervisionado: Regressão

ML Supervisionado: Classificação

Árvores de Decisão e Ensembles

ML Não Supervisionado

Pipelines ML e Validação

Séries Temporais e Previsão

Fundamentos de Deep Learning

TensorFlow & Keras

CNN e classificação de imagens

Transformers e Attention

NLP e Hugging Face

GenAI e LangChain

MLOps e Implantação

Domine Data Science & ML para sua proxima entrevista