Question 1

Was ist das Hauptmerkmal, das ein RNN von einem klassischen Feedforward-Neuronalen Netzwerk unterscheidet?

Accepted Answer

Ein RNN besitzt rekurrente Verbindungen, die einen Hidden State aufrechterhalten, der sich über die Zeit entwickelt. Dieser Hidden State fungiert als Speicher, der Informationen aus vorherigen Eingaben der Sequenz erfasst. Im Gegensatz zu Feedforward-Netzwerken, bei denen jede Eingabe unabhängig verarbeitet wird, können RNN zeitliche Abhängigkeiten zwischen Sequenzelementen modellieren.

Question 2

Wie wird der Hidden State h_t in einem einfachen RNN (vanilla RNN) bei jedem Zeitschritt berechnet?

Accepted Answer

In einem vanilla RNN wird der Hidden State h_t berechnet, indem eine Aktivierungsfunktion (üblicherweise tanh) auf die lineare Kombination der aktuellen Eingabe x_t gewichtet mit W_xh und des vorherigen Hidden State h_{t-1} gewichtet mit W_hh angewendet wird, plus einem Bias. Diese Formel ermöglicht es dem Netzwerk, neue Informationen mit dem Speicher früherer Zeitschritte zu kombinieren.

Question 3

Was ist das Hauptproblem des Vanishing Gradient in RNN und wann tritt es auf?

Accepted Answer

Vanishing Gradient tritt während der Backpropagation Through Time (BPTT) auf, wenn Gradienten viele Male mit Werten kleiner als 1 multipliziert werden. Bei langen Sequenzen werden diese Gradienten exponentiell klein, was das Netzwerk daran hindert, Langzeitabhängigkeiten zu lernen. Die Gewichte der frühen zeitlichen Schichten werden kaum aktualisiert.

RNN & Sequenzen

Was ist das Hauptmerkmal, das ein RNN von einem klassischen Feedforward-Neuronalen Netzwerk unterscheidet?

Antwort

Wie wird der Hidden State h_t in einem einfachen RNN (vanilla RNN) bei jedem Zeitschritt berechnet?

Antwort

Was ist das Hauptproblem des Vanishing Gradient in RNN und wann tritt es auf?

Antwort

Was sind die drei Gates, aus denen eine LSTM-Zelle besteht, und welche Rolle haben sie jeweils?

Wie löst LSTM das Vanishing-Gradient-Problem im Vergleich zu vanilla RNN?

Weitere Data Science & ML-Interviewthemen

Python-Grundlagen

Python Objektorientierte Programmierung

Python-Datenstrukturen

Git-Grundlagen

SQL-Grundlagen

NumPy-Grundlagen

Pandas-Grundlagen

Jupyter & Google Colab

SQL Joins & fortgeschrittene Abfragen

Fortgeschrittenes Pandas

Visualisierung mit Matplotlib & Seaborn

Interaktive Visualisierungen mit Plotly

Deskriptive Statistik

Inferenzstatistik

Web Scraping

BigQuery & Cloud Data

Feature Engineering

Überwachtes ML: Regression

Überwachtes ML: Klassifikation

Entscheidungsbäume & Ensembles

Unüberwachtes ML

ML-Pipelines & Validierung

Zeitreihen & Prognosen

Grundlagen des Deep Learning

TensorFlow & Keras

CNN und Bildklassifizierung

Transformers & Attention

NLP & Hugging Face

GenAI & LangChain

MLOps und Deployment

Meistere Data Science & ML für dein nächstes Interview