
비지도 ML
K-Means, 계층적 클러스터링, DBSCAN, PCA, t-SNE, UMAP, silhouette score, elbow method
22 면접 질문·
Mid-Level
1지도 학습과 비지도 학습의 주요 차이점은 무엇입니까?
1
지도 학습과 비지도 학습의 주요 차이점은 무엇입니까?
답변
비지도 학습은 레이블이 없는 데이터로 작업하며, 미리 정의된 타겟 변수 없이 숨겨진 구조나 패턴을 발견하려고 합니다. 알려진 값(레이블)을 예측하는 지도 학습과 달리, 비지도 학습은 데이터를 탐색하여 자연스러운 그룹을 찾거나 차원을 축소하거나 이상치를 탐지합니다. K-Means, PCA, DBSCAN과 같은 알고리즘은 비지도 학습의 전형적인 예입니다.
2K-Means 알고리즘은 데이터를 분할하기 위해 어떻게 작동합니까?
2
K-Means 알고리즘은 데이터를 분할하기 위해 어떻게 작동합니까?
답변
K-Means는 데이터를 K개의 클러스터로 분할하는 반복적 알고리즘입니다. K개의 센트로이드를 무작위로 초기화한 다음, 두 단계를 번갈아 수행합니다: 각 점을 가장 가까운 센트로이드에 할당(할당 단계)하고 할당된 점들의 평균으로 센트로이드 위치를 재계산(업데이트 단계)합니다. 할당이 더 이상 변경되지 않거나 최대 반복 횟수에 도달하면 알고리즘이 수렴합니다.
3K-Means에서 최적의 클러스터 수 K를 결정하기 위해 어떤 방법을 사용해야 합니까?
3
K-Means에서 최적의 클러스터 수 K를 결정하기 위해 어떤 방법을 사용해야 합니까?
답변
elbow method는 관성(각 점과 그 센트로이드 사이의 거리 제곱의 합)을 K에 대해 플롯합니다. 곡선이 팔꿈치를 형성하는 지점이 최적의 K를 나타내며, 그 이상으로 클러스터를 추가해도 관성이 크게 개선되지 않습니다. 이 방법은 silhouette score로 보완되어 클러스터 품질을 검증합니다.
4
클러스터링 맥락에서 silhouette score는 무엇을 측정합니까?
5
silhouette score의 값 범위는 무엇이며 0.7의 점수를 어떻게 해석합니까?
+19 면접 질문
기타 Data Science & ML 면접 주제
Python 기초
Junior
25개 질문Python 객체 지향 프로그래밍
Junior
20개 질문Python 데이터 구조
Junior
20개 질문Git 기초
Junior
18개 질문SQL 기초
Junior
20개 질문NumPy 기초
Junior
22개 질문Pandas 기초
Junior
22개 질문Jupyter & Google Colab
Junior
16개 질문SQL Joins 및 고급 쿼리
Mid-Level
22개 질문Pandas 고급
Mid-Level
24개 질문Matplotlib & Seaborn을 활용한 시각화
Mid-Level
20개 질문Plotly로 만드는 인터랙티브 시각화
Mid-Level
18개 질문기술 통계
Mid-Level
20개 질문추론 통계학
Mid-Level
24개 질문Web Scraping
Mid-Level
18개 질문BigQuery & Cloud Data
Mid-Level
18개 질문Feature Engineering
Mid-Level
22개 질문지도 머신러닝: 회귀
Mid-Level
24개 질문지도 머신러닝: 분류
Mid-Level
24개 질문결정 트리 및 앙상블
Mid-Level
24개 질문ML 파이프라인 및 검증
Mid-Level
22개 질문시계열 및 예측
Mid-Level
22개 질문Deep Learning 기초
Senior
24개 질문TensorFlow & Keras
Senior
22개 질문CNN 및 이미지 분류
Senior
24개 질문RNN 및 시퀀스
Senior
22개 질문Transformers 및 Attention
Senior
24개 질문NLP 및 Hugging Face
Senior
24개 질문GenAI 및 LangChain
Senior
24개 질문MLOps 및 배포
Senior
24개 질문