Question 1

RNN을 일반적인 피드포워드 신경망과 구별하는 주요 특징은 무엇입니까?

Accepted Answer

RNN은 시간이 지남에 따라 변화하는 hidden state를 유지하는 순환 연결을 가지고 있습니다. 이 hidden state는 시퀀스의 이전 입력 정보를 포착하는 메모리 역할을 합니다. 각 입력이 독립적으로 처리되는 피드포워드 네트워크와 달리, RNN은 시퀀스 요소 간의 시간적 종속성을 모델링할 수 있습니다.

Question 2

단순 RNN(vanilla RNN)에서 각 타임 스텝의 hidden state h_t는 어떻게 계산됩니까?

Accepted Answer

vanilla RNN에서 hidden state h_t는 W_xh로 가중치가 부여된 현재 입력 x_t와 W_hh로 가중치가 부여된 이전 hidden state h_{t-1}의 선형 결합에 bias를 더한 값에 활성화 함수(보통 tanh)를 적용하여 계산됩니다. 이 공식을 통해 네트워크는 새로운 정보와 이전 타임 스텝의 메모리를 결합할 수 있습니다.

Question 3

RNN에서 주요한 vanishing gradient 문제는 무엇이며 언제 발생합니까?

Accepted Answer

vanishing gradient는 backpropagation through time(BPTT) 중에 그래디언트가 1보다 작은 값으로 여러 번 곱해질 때 발생합니다. 긴 시퀀스에서 이러한 그래디언트는 기하급수적으로 작아지며, 네트워크가 장기 종속성을 학습하는 것을 방해합니다. 초기 시간 레이어의 가중치는 거의 업데이트되지 않습니다.

RNN 및 시퀀스

RNN을 일반적인 피드포워드 신경망과 구별하는 주요 특징은 무엇입니까?

답변

단순 RNN(vanilla RNN)에서 각 타임 스텝의 hidden state h_t는 어떻게 계산됩니까?

답변

RNN에서 주요한 vanishing gradient 문제는 무엇이며 언제 발생합니까?

답변

LSTM 셀을 구성하는 세 가지 게이트는 무엇이며 각각의 역할은 무엇입니까?

LSTM은 vanilla RNN과 비교하여 vanishing gradient 문제를 어떻게 해결합니까?

기타 Data Science & ML 면접 주제

Python 기초

Python 객체 지향 프로그래밍

Python 데이터 구조

Git 기초

SQL 기초

NumPy 기초

Pandas 기초

Jupyter & Google Colab

SQL Joins 및 고급 쿼리

Pandas 고급

Matplotlib & Seaborn을 활용한 시각화

Plotly로 만드는 인터랙티브 시각화

기술 통계

추론 통계학

Web Scraping

BigQuery & Cloud Data

Feature Engineering

지도 머신러닝: 회귀

지도 머신러닝: 분류

결정 트리 및 앙상블

비지도 ML

ML 파이프라인 및 검증

시계열 및 예측

Deep Learning 기초

TensorFlow & Keras

CNN 및 이미지 분류

Transformers 및 Attention

NLP 및 Hugging Face

GenAI 및 LangChain

MLOps 및 배포

다음 면접을 위해 Data Science & ML을 마스터하세요