Data Science & ML

RNN ve Diziler

RNN, LSTM, GRU, vanishing gradient, zaman serileri, tahminler, sequence-to-sequence

22 mülakat soruları·
Senior
1

Bir RNN'yi klasik bir feedforward sinir ağından ayıran temel özellik nedir?

Cevap

Bir RNN, zaman içinde gelişen bir gizli durumu (hidden state) koruyan yinelemeli bağlantılara sahiptir. Bu gizli durum, dizideki önceki girdilerden bilgi yakalayan bir bellek görevi görür. Her girdinin bağımsız olarak işlendiği feedforward ağlarının aksine, RNN dizi öğeleri arasındaki zamansal bağımlılıkları modelleyebilir.

2

Basit bir RNN'de (vanilla RNN) her zaman adımında gizli durum h_t nasıl hesaplanır?

Cevap

Vanilla RNN'de gizli durum h_t, W_xh ile ağırlıklandırılmış mevcut girdi x_t ve W_hh ile ağırlıklandırılmış önceki gizli durum h_{t-1}'nin doğrusal kombinasyonuna bir bias eklenip aktivasyon fonksiyonu (genellikle tanh) uygulanarak hesaplanır. Bu formül, ağın yeni bilgiyi önceki zaman adımlarının belleğiyle birleştirmesine olanak tanır.

3

RNN'lerde vanishing gradient'in temel sorunu nedir ve ne zaman ortaya çıkar?

Cevap

Vanishing gradient, backpropagation through time (BPTT) sırasında gradyanların 1'den küçük değerlerle çok kez çarpılmasıyla oluşur. Uzun dizilerde bu gradyanlar üstel olarak küçülür ve ağın uzun vadeli bağımlılıkları öğrenmesini engeller. Erken zamansal katmanların ağırlıkları neredeyse hiç güncellenmez.

4

Bir LSTM hücresini oluşturan üç gate nedir ve her birinin rolü nedir?

5

LSTM, vanilla RNN'ye kıyasla vanishing gradient sorununu nasıl çözer?

+19 mülakat soruları

Bir sonraki mülakatın için Data Science & ML'de uzmanlaş

Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.

Ücretsiz başla