Data Science & ML

비지도 ML

K-Means, 계층적 클러스터링, DBSCAN, PCA, t-SNE, UMAP, silhouette score, elbow method

22 면접 질문·
Mid-Level
1

지도 학습과 비지도 학습의 주요 차이점은 무엇입니까?

답변

비지도 학습은 레이블이 없는 데이터로 작업하며, 미리 정의된 타겟 변수 없이 숨겨진 구조나 패턴을 발견하려고 합니다. 알려진 값(레이블)을 예측하는 지도 학습과 달리, 비지도 학습은 데이터를 탐색하여 자연스러운 그룹을 찾거나 차원을 축소하거나 이상치를 탐지합니다. K-Means, PCA, DBSCAN과 같은 알고리즘은 비지도 학습의 전형적인 예입니다.

2

K-Means 알고리즘은 데이터를 분할하기 위해 어떻게 작동합니까?

답변

K-Means는 데이터를 K개의 클러스터로 분할하는 반복적 알고리즘입니다. K개의 센트로이드를 무작위로 초기화한 다음, 두 단계를 번갈아 수행합니다: 각 점을 가장 가까운 센트로이드에 할당(할당 단계)하고 할당된 점들의 평균으로 센트로이드 위치를 재계산(업데이트 단계)합니다. 할당이 더 이상 변경되지 않거나 최대 반복 횟수에 도달하면 알고리즘이 수렴합니다.

3

K-Means에서 최적의 클러스터 수 K를 결정하기 위해 어떤 방법을 사용해야 합니까?

답변

elbow method는 관성(각 점과 그 센트로이드 사이의 거리 제곱의 합)을 K에 대해 플롯합니다. 곡선이 팔꿈치를 형성하는 지점이 최적의 K를 나타내며, 그 이상으로 클러스터를 추가해도 관성이 크게 개선되지 않습니다. 이 방법은 silhouette score로 보완되어 클러스터 품질을 검증합니다.

4

클러스터링 맥락에서 silhouette score는 무엇을 측정합니까?

5

silhouette score의 값 범위는 무엇이며 0.7의 점수를 어떻게 해석합니까?

+19 면접 질문

다음 면접을 위해 Data Science & ML을 마스터하세요

모든 질문, flashcards, 기술 테스트, 코드 리뷰 연습, 면접 시뮬레이터에 접근하세요.

무료로 시작하기