Question 1

Qual è la caratteristica principale che distingue una RNN da una rete neurale feedforward classica?

Accepted Answer

Una RNN ha connessioni ricorrenti che mantengono un hidden state che evolve nel tempo. Questo hidden state agisce come una memoria che cattura le informazioni dagli input precedenti nella sequenza. A differenza delle reti feedforward dove ogni input è elaborato indipendentemente, le RNN possono modellare le dipendenze temporali tra gli elementi di una sequenza.

Question 2

Come viene calcolato l'hidden state h_t in una RNN semplice (vanilla RNN) ad ogni time step?

Accepted Answer

In una vanilla RNN, l'hidden state h_t è calcolato applicando una funzione di attivazione (di solito tanh) alla combinazione lineare dell'input attuale x_t ponderato da W_xh e dell'hidden state precedente h_{t-1} ponderato da W_hh, più un bias. Questa formula permette alla rete di combinare le nuove informazioni con la memoria dei time step precedenti.

Question 3

Qual è il principale problema del vanishing gradient nelle RNN e quando si manifesta?

Accepted Answer

Il vanishing gradient si verifica durante la backpropagation through time (BPTT) quando i gradienti vengono moltiplicati molte volte per valori inferiori a 1. Su sequenze lunghe, questi gradienti diventano esponenzialmente piccoli, impedendo alla rete di apprendere dipendenze a lungo termine. I pesi dei primi layer temporali sono a malapena aggiornati.

RNN e Sequenze

Qual è la caratteristica principale che distingue una RNN da una rete neurale feedforward classica?

Risposta

Come viene calcolato l'hidden state h_t in una RNN semplice (vanilla RNN) ad ogni time step?

Risposta

Qual è il principale problema del vanishing gradient nelle RNN e quando si manifesta?

Risposta

Quali sono i tre gate che compongono una cella LSTM e qual è il loro ruolo rispettivo?

Come l'LSTM risolve il problema del vanishing gradient rispetto alla vanilla RNN?

Altri argomenti di colloquio Data Science & ML

Fondamenti di Python

Programmazione Orientata agli Oggetti in Python

Strutture dati Python

Fondamenti di Git

Fondamenti di SQL

Fondamenti di NumPy

Fondamenti di Pandas

Jupyter & Google Colab

SQL Joins e query avanzate

Pandas avanzato

Visualizzazione con Matplotlib & Seaborn

Visualizzazioni interattive con Plotly

Statistica descrittiva

Statistica inferenziale

Web Scraping

BigQuery & Cloud Data

Feature Engineering

ML Supervisionato: Regressione

ML Supervisionato: Classificazione

Alberi Decisionali e Ensembles

ML Non Supervisionato

Pipeline ML e Validazione

Serie Temporali e Previsione

Fondamenti di Deep Learning

TensorFlow & Keras

CNN e classificazione di immagini

Transformers e Attention

NLP e Hugging Face

GenAI e LangChain

MLOps e Deployment

Padroneggia Data Science & ML per il tuo prossimo colloquio