
RNN y Secuencias
RNN, LSTM, GRU, vanishing gradient, series temporales, pronósticos, sequence-to-sequence
1¿Cuál es la característica principal que distingue a una RNN de una red neuronal feedforward clásica?
¿Cuál es la característica principal que distingue a una RNN de una red neuronal feedforward clásica?
Respuesta
Una RNN tiene conexiones recurrentes que mantienen un hidden state que evoluciona con el tiempo. Este hidden state actúa como una memoria que captura la información de las entradas anteriores en la secuencia. A diferencia de las redes feedforward, donde cada entrada se procesa de forma independiente, las RNN pueden modelar dependencias temporales entre los elementos de una secuencia.
2¿Cómo se calcula el hidden state h_t en una RNN simple (vanilla RNN) en cada time step?
¿Cómo se calcula el hidden state h_t en una RNN simple (vanilla RNN) en cada time step?
Respuesta
En una vanilla RNN, el hidden state h_t se calcula aplicando una función de activación (generalmente tanh) a la combinación lineal de la entrada actual x_t ponderada por W_xh y el hidden state anterior h_{t-1} ponderado por W_hh, más un bias. Esta fórmula permite a la red combinar la nueva información con la memoria de los time steps anteriores.
3¿Cuál es el principal problema del vanishing gradient en las RNN y cuándo se manifiesta?
¿Cuál es el principal problema del vanishing gradient en las RNN y cuándo se manifiesta?
Respuesta
El vanishing gradient ocurre durante la backpropagation through time (BPTT) cuando los gradientes se multiplican muchas veces por valores menores que 1. Sobre secuencias largas, estos gradientes se vuelven exponencialmente pequeños, impidiendo que la red aprenda dependencias a largo plazo. Los pesos de las primeras capas temporales casi no se actualizan.
¿Cuáles son las tres gates (puertas) que componen una celda LSTM y cuál es su rol respectivo?
¿Cómo resuelve el LSTM el problema del vanishing gradient en comparación con la vanilla RNN?
+19 preguntas de entrevista
Otros temas de entrevista Data Science & ML
Fundamentos de Python
Programación Orientada a Objetos en Python
Estructuras de datos en Python
Fundamentos de Git
Fundamentos de SQL
Fundamentos de NumPy
Fundamentos de Pandas
Jupyter & Google Colab
SQL Joins y consultas avanzadas
Pandas avanzado
Visualización con Matplotlib & Seaborn
Visualizaciones interactivas con Plotly
Estadística descriptiva
Estadística inferencial
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML Supervisado: Regresión
ML Supervisado: Clasificación
Árboles de Decisión y Ensembles
ML No Supervisado
Pipelines ML y Validación
Series Temporales y Pronóstico
Fundamentos de Deep Learning
TensorFlow & Keras
CNN y clasificación de imágenes
Transformers y Attention
NLP y Hugging Face
GenAI y LangChain
MLOps y Despliegue
Domina Data Science & ML para tu próxima entrevista
Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.
Empieza gratis