
Transformers 및 Attention
attention 메커니즘, self-attention, multi-head attention, Transformer 아키텍처, positional encoding
24 면접 질문·
Senior
1시퀀스 처리에서 attention 메커니즘이 RNN에 비해 갖는 주요 장점은 무엇입니까?
1
시퀀스 처리에서 attention 메커니즘이 RNN에 비해 갖는 주요 장점은 무엇입니까?
답변
attention 메커니즘은 시퀀스의 모든 위치에 직접 접근할 수 있게 하여 RNN의 순차적 병목 현상을 제거합니다. 정보를 단계별로 전파해야 하는 RNN과 달리, attention은 모든 위치 간의 직접적인 연결을 계산하여 대규모 병렬화를 가능하게 하고 그래디언트 저하 없이 장거리 의존성을 포착합니다.
2attention 메커니즘에서 Query (Q), Key (K), Value (V) 벡터는 무엇을 나타냅니까?
2
attention 메커니즘에서 Query (Q), Key (K), Value (V) 벡터는 무엇을 나타냅니까?
답변
Query는 토큰이 찾고 있는 것을 나타내고, Key는 각 토큰이 일치 항목으로 제공할 수 있는 것을 나타내며, Value는 검색할 정보를 포함합니다. attention 점수는 Q와 K 사이에서 계산되어 상대적 중요도를 결정한 다음 V에 가중치를 부여하는 데 사용됩니다. 이 비유는 쿼리가 키와 비교되어 값을 검색하는 정보 검색 시스템에서 유래합니다.
3scaled dot-product attention의 공식은 무엇이며 왜 dk의 제곱근으로 나누는 것입니까?
3
scaled dot-product attention의 공식은 무엇이며 왜 dk의 제곱근으로 나누는 것입니까?
답변
공식은 Attention(Q,K,V) = softmax(QK^T / sqrt(dk)) * V입니다. sqrt(dk)로 나누는 것은 매우 중요합니다. 왜냐하면 고차원 벡터의 내적은 큰 크기를 가지는 경향이 있어 softmax를 매우 작은 그래디언트 영역으로 밀어내기 때문입니다. 이 정규화는 attention 점수의 안정적인 분산을 유지하여 효율적인 학습을 보장합니다.
4
attention과 self-attention의 근본적인 차이점은 무엇입니까?
5
단일 attention head 대신 multi-head attention을 사용하는 이유는 무엇입니까?
+21 면접 질문
기타 Data Science & ML 면접 주제
Python 기초
Junior
25개 질문Python 객체 지향 프로그래밍
Junior
20개 질문Python 데이터 구조
Junior
20개 질문Git 기초
Junior
18개 질문SQL 기초
Junior
20개 질문NumPy 기초
Junior
22개 질문Pandas 기초
Junior
22개 질문Jupyter & Google Colab
Junior
16개 질문SQL Joins 및 고급 쿼리
Mid-Level
22개 질문Pandas 고급
Mid-Level
24개 질문Matplotlib & Seaborn을 활용한 시각화
Mid-Level
20개 질문Plotly로 만드는 인터랙티브 시각화
Mid-Level
18개 질문기술 통계
Mid-Level
20개 질문추론 통계학
Mid-Level
24개 질문Web Scraping
Mid-Level
18개 질문BigQuery & Cloud Data
Mid-Level
18개 질문Feature Engineering
Mid-Level
22개 질문지도 머신러닝: 회귀
Mid-Level
24개 질문지도 머신러닝: 분류
Mid-Level
24개 질문결정 트리 및 앙상블
Mid-Level
24개 질문비지도 ML
Mid-Level
22개 질문ML 파이프라인 및 검증
Mid-Level
22개 질문시계열 및 예측
Mid-Level
22개 질문Deep Learning 기초
Senior
24개 질문TensorFlow & Keras
Senior
22개 질문CNN 및 이미지 분류
Senior
24개 질문RNN 및 시퀀스
Senior
22개 질문NLP 및 Hugging Face
Senior
24개 질문GenAI 및 LangChain
Senior
24개 질문MLOps 및 배포
Senior
24개 질문