Data Science & ML

RNNとシーケンス

RNN、LSTM、GRU、vanishing gradient、時系列、予測、sequence-to-sequence

22 面接問題·
Senior
1

RNNを従来のフィードフォワードニューラルネットワークと区別する主な特徴は何ですか?

回答

RNNは時間とともに進化する隠れ状態(hidden state)を維持する再帰的な接続を持っています。この隠れ状態は、シーケンス内の以前の入力からの情報を捕捉するメモリとして機能します。各入力が独立して処理されるフィードフォワードネットワークとは異なり、RNNはシーケンス要素間の時間的依存関係をモデル化できます。

2

シンプルなRNN(vanilla RNN)では、各タイムステップで隠れ状態h_tはどのように計算されますか?

回答

vanilla RNNでは、隠れ状態h_tは、W_xhで重み付けされた現在の入力x_tとW_hhで重み付けされた前の隠れ状態h_{t-1}の線形結合にバイアスを加えたものに、活性化関数(通常はtanh)を適用することで計算されます。この式により、ネットワークは新しい情報と前のタイムステップのメモリを組み合わせることができます。

3

RNNにおける主なvanishing gradient問題とは何で、いつ発生しますか?

回答

vanishing gradientは、backpropagation through time(BPTT)中に、勾配が1未満の値で何度も乗算されるときに発生します。長いシーケンスでは、これらの勾配は指数関数的に小さくなり、ネットワークが長期的な依存関係を学習できなくなります。初期の時間レイヤーの重みはほとんど更新されません。

4

LSTMセルを構成する3つのゲートは何で、それぞれの役割は何ですか?

5

LSTMは、vanilla RNNと比較してvanishing gradientの問題をどのように解決しますか?

+19 面接問題

次の面接に向けてData Science & MLをマスター

すべての問題、flashcards、技術テスト、コードレビュー演習、面接シミュレーターにアクセス。

無料で始める