Question 1

¿Cuál es la característica principal que distingue a una RNN de una red neuronal feedforward clásica?

Accepted Answer

Una RNN tiene conexiones recurrentes que mantienen un hidden state que evoluciona con el tiempo. Este hidden state actúa como una memoria que captura la información de las entradas anteriores en la secuencia. A diferencia de las redes feedforward, donde cada entrada se procesa de forma independiente, las RNN pueden modelar dependencias temporales entre los elementos de una secuencia.

Question 2

¿Cómo se calcula el hidden state h_t en una RNN simple (vanilla RNN) en cada time step?

Accepted Answer

En una vanilla RNN, el hidden state h_t se calcula aplicando una función de activación (generalmente tanh) a la combinación lineal de la entrada actual x_t ponderada por W_xh y el hidden state anterior h_{t-1} ponderado por W_hh, más un bias. Esta fórmula permite a la red combinar la nueva información con la memoria de los time steps anteriores.

Question 3

¿Cuál es el principal problema del vanishing gradient en las RNN y cuándo se manifiesta?

Accepted Answer

El vanishing gradient ocurre durante la backpropagation through time (BPTT) cuando los gradientes se multiplican muchas veces por valores menores que 1. Sobre secuencias largas, estos gradientes se vuelven exponencialmente pequeños, impidiendo que la red aprenda dependencias a largo plazo. Los pesos de las primeras capas temporales casi no se actualizan.

RNN y Secuencias

¿Cuál es la característica principal que distingue a una RNN de una red neuronal feedforward clásica?

Respuesta

¿Cómo se calcula el hidden state h_t en una RNN simple (vanilla RNN) en cada time step?

Respuesta

¿Cuál es el principal problema del vanishing gradient en las RNN y cuándo se manifiesta?

Respuesta

¿Cuáles son las tres gates (puertas) que componen una celda LSTM y cuál es su rol respectivo?

¿Cómo resuelve el LSTM el problema del vanishing gradient en comparación con la vanilla RNN?

Otros temas de entrevista Data Science & ML

Fundamentos de Python

Programación Orientada a Objetos en Python

Estructuras de datos en Python

Fundamentos de Git

Fundamentos de SQL

Fundamentos de NumPy

Fundamentos de Pandas

Jupyter & Google Colab

SQL Joins y consultas avanzadas

Pandas avanzado

Visualización con Matplotlib & Seaborn

Visualizaciones interactivas con Plotly

Estadística descriptiva

Estadística inferencial

Web Scraping

BigQuery & Cloud Data

Feature Engineering

ML Supervisado: Regresión

ML Supervisado: Clasificación

Árboles de Decisión y Ensembles

ML No Supervisado

Pipelines ML y Validación

Series Temporales y Pronóstico

Fundamentos de Deep Learning

TensorFlow & Keras

CNN y clasificación de imágenes

Transformers y Attention

NLP y Hugging Face

GenAI y LangChain

MLOps y Despliegue

Domina Data Science & ML para tu próxima entrevista