Data Science & ML

RNN 및 시퀀스

RNN, LSTM, GRU, vanishing gradient, 시계열, 예측, sequence-to-sequence

22 면접 질문·
Senior
1

RNN을 일반적인 피드포워드 신경망과 구별하는 주요 특징은 무엇입니까?

답변

RNN은 시간이 지남에 따라 변화하는 hidden state를 유지하는 순환 연결을 가지고 있습니다. 이 hidden state는 시퀀스의 이전 입력 정보를 포착하는 메모리 역할을 합니다. 각 입력이 독립적으로 처리되는 피드포워드 네트워크와 달리, RNN은 시퀀스 요소 간의 시간적 종속성을 모델링할 수 있습니다.

2

단순 RNN(vanilla RNN)에서 각 타임 스텝의 hidden state h_t는 어떻게 계산됩니까?

답변

vanilla RNN에서 hidden state h_t는 W_xh로 가중치가 부여된 현재 입력 x_t와 W_hh로 가중치가 부여된 이전 hidden state h_{t-1}의 선형 결합에 bias를 더한 값에 활성화 함수(보통 tanh)를 적용하여 계산됩니다. 이 공식을 통해 네트워크는 새로운 정보와 이전 타임 스텝의 메모리를 결합할 수 있습니다.

3

RNN에서 주요한 vanishing gradient 문제는 무엇이며 언제 발생합니까?

답변

vanishing gradient는 backpropagation through time(BPTT) 중에 그래디언트가 1보다 작은 값으로 여러 번 곱해질 때 발생합니다. 긴 시퀀스에서 이러한 그래디언트는 기하급수적으로 작아지며, 네트워크가 장기 종속성을 학습하는 것을 방해합니다. 초기 시간 레이어의 가중치는 거의 업데이트되지 않습니다.

4

LSTM 셀을 구성하는 세 가지 게이트는 무엇이며 각각의 역할은 무엇입니까?

5

LSTM은 vanilla RNN과 비교하여 vanishing gradient 문제를 어떻게 해결합니까?

+19 면접 질문

다음 면접을 위해 Data Science & ML을 마스터하세요

모든 질문, flashcards, 기술 테스트, 코드 리뷰 연습, 면접 시뮬레이터에 접근하세요.

무료로 시작하기