Data Science & ML

RNN & Sekuens

RNN, LSTM, GRU, vanishing gradient, time series, peramalan, sequence-to-sequence

22 pertanyaan wawancaraยท
Senior
1

Apa karakteristik utama yang membedakan RNN dari jaringan saraf feedforward klasik?

Jawaban

RNN memiliki koneksi rekuren yang mempertahankan hidden state yang berkembang seiring waktu. Hidden state ini bertindak sebagai memori yang menangkap informasi dari input sebelumnya dalam sekuens. Berbeda dengan jaringan feedforward di mana setiap input diproses secara independen, RNN dapat memodelkan ketergantungan temporal antara elemen-elemen sekuens.

2

Bagaimana hidden state h_t dihitung dalam RNN sederhana (vanilla RNN) pada setiap time step?

Jawaban

Dalam vanilla RNN, hidden state h_t dihitung dengan menerapkan fungsi aktivasi (biasanya tanh) pada kombinasi linier dari input saat ini x_t yang dibobotkan dengan W_xh dan hidden state sebelumnya h_{t-1} yang dibobotkan dengan W_hh, ditambah bias. Formula ini memungkinkan jaringan menggabungkan informasi baru dengan memori dari time steps sebelumnya.

3

Apa masalah utama vanishing gradient pada RNN dan kapan terjadi?

Jawaban

Vanishing gradient terjadi selama backpropagation through time (BPTT) ketika gradien dikalikan berkali-kali dengan nilai kurang dari 1. Pada sekuens panjang, gradien ini menjadi sangat kecil secara eksponensial, mencegah jaringan mempelajari ketergantungan jangka panjang. Bobot lapisan temporal awal hampir tidak diperbarui.

4

Apa tiga gate yang menyusun sel LSTM dan apa peran masing-masingnya?

5

Bagaimana LSTM menyelesaikan masalah vanishing gradient dibandingkan dengan vanilla RNN?

+19 pertanyaan wawancara

Kuasai Data Science & ML untuk wawancara berikutnya

Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.

Mulai gratis