Data Science & ML

RNN y Secuencias

RNN, LSTM, GRU, vanishing gradient, series temporales, pronósticos, sequence-to-sequence

22 preguntas de entrevista·
Senior
1

¿Cuál es la característica principal que distingue a una RNN de una red neuronal feedforward clásica?

Respuesta

Una RNN tiene conexiones recurrentes que mantienen un hidden state que evoluciona con el tiempo. Este hidden state actúa como una memoria que captura la información de las entradas anteriores en la secuencia. A diferencia de las redes feedforward, donde cada entrada se procesa de forma independiente, las RNN pueden modelar dependencias temporales entre los elementos de una secuencia.

2

¿Cómo se calcula el hidden state h_t en una RNN simple (vanilla RNN) en cada time step?

Respuesta

En una vanilla RNN, el hidden state h_t se calcula aplicando una función de activación (generalmente tanh) a la combinación lineal de la entrada actual x_t ponderada por W_xh y el hidden state anterior h_{t-1} ponderado por W_hh, más un bias. Esta fórmula permite a la red combinar la nueva información con la memoria de los time steps anteriores.

3

¿Cuál es el principal problema del vanishing gradient en las RNN y cuándo se manifiesta?

Respuesta

El vanishing gradient ocurre durante la backpropagation through time (BPTT) cuando los gradientes se multiplican muchas veces por valores menores que 1. Sobre secuencias largas, estos gradientes se vuelven exponencialmente pequeños, impidiendo que la red aprenda dependencias a largo plazo. Los pesos de las primeras capas temporales casi no se actualizan.

4

¿Cuáles son las tres gates (puertas) que componen una celda LSTM y cuál es su rol respectivo?

5

¿Cómo resuelve el LSTM el problema del vanishing gradient en comparación con la vanilla RNN?

+19 preguntas de entrevista

Domina Data Science & ML para tu próxima entrevista

Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.

Empieza gratis