Data Science & ML

RNN i Sekwencje

RNN, LSTM, GRU, vanishing gradient, szeregi czasowe, prognozowanie, sequence-to-sequence

22 pytań z rozmów·
Senior
1

Jaka jest główna cecha odróżniająca RNN od klasycznej sieci neuronowej feedforward?

Odpowiedź

RNN posiada połączenia rekurencyjne, które utrzymują hidden state ewoluujący w czasie. Ten hidden state działa jak pamięć przechwytująca informacje z poprzednich wejść w sekwencji. W przeciwieństwie do sieci feedforward, gdzie każde wejście jest przetwarzane niezależnie, RNN potrafią modelować zależności czasowe między elementami sekwencji.

2

Jak obliczany jest hidden state h_t w prostym RNN (vanilla RNN) w każdym kroku czasowym?

Odpowiedź

W vanilla RNN hidden state h_t jest obliczany przez zastosowanie funkcji aktywacji (zwykle tanh) do liniowej kombinacji bieżącego wejścia x_t ważonego przez W_xh i poprzedniego hidden state h_{t-1} ważonego przez W_hh, plus bias. Ten wzór pozwala sieci łączyć nowe informacje z pamięcią poprzednich kroków czasowych.

3

Jaki jest główny problem vanishing gradient w RNN i kiedy się pojawia?

Odpowiedź

Vanishing gradient występuje podczas backpropagation through time (BPTT), gdy gradienty są wielokrotnie mnożone przez wartości mniejsze niż 1. Na długich sekwencjach gradienty te stają się wykładniczo małe, uniemożliwiając sieci uczenie się zależności długoterminowych. Wagi wczesnych warstw czasowych są prawie nieaktualizowane.

4

Jakie są trzy bramki tworzące komórkę LSTM i jaka jest ich rola?

5

Jak LSTM rozwiązuje problem vanishing gradient w porównaniu z vanilla RNN?

+19 pytań z rozmów

Opanuj Data Science & ML na następną rozmowę

Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.

Zacznij za darmo