Question 1

지도 학습과 비지도 학습의 주요 차이점은 무엇입니까?

Accepted Answer

비지도 학습은 레이블이 없는 데이터로 작업하며, 미리 정의된 타겟 변수 없이 숨겨진 구조나 패턴을 발견하려고 합니다. 알려진 값(레이블)을 예측하는 지도 학습과 달리, 비지도 학습은 데이터를 탐색하여 자연스러운 그룹을 찾거나 차원을 축소하거나 이상치를 탐지합니다. K-Means, PCA, DBSCAN과 같은 알고리즘은 비지도 학습의 전형적인 예입니다.

Question 2

K-Means 알고리즘은 데이터를 분할하기 위해 어떻게 작동합니까?

Accepted Answer

K-Means는 데이터를 K개의 클러스터로 분할하는 반복적 알고리즘입니다. K개의 센트로이드를 무작위로 초기화한 다음, 두 단계를 번갈아 수행합니다: 각 점을 가장 가까운 센트로이드에 할당(할당 단계)하고 할당된 점들의 평균으로 센트로이드 위치를 재계산(업데이트 단계)합니다. 할당이 더 이상 변경되지 않거나 최대 반복 횟수에 도달하면 알고리즘이 수렴합니다.

Question 3

K-Means에서 최적의 클러스터 수 K를 결정하기 위해 어떤 방법을 사용해야 합니까?

Accepted Answer

elbow method는 관성(각 점과 그 센트로이드 사이의 거리 제곱의 합)을 K에 대해 플롯합니다. 곡선이 팔꿈치를 형성하는 지점이 최적의 K를 나타내며, 그 이상으로 클러스터를 추가해도 관성이 크게 개선되지 않습니다. 이 방법은 silhouette score로 보완되어 클러스터 품질을 검증합니다.

비지도 ML

지도 학습과 비지도 학습의 주요 차이점은 무엇입니까?

답변

K-Means 알고리즘은 데이터를 분할하기 위해 어떻게 작동합니까?

답변

K-Means에서 최적의 클러스터 수 K를 결정하기 위해 어떤 방법을 사용해야 합니까?

답변

클러스터링 맥락에서 silhouette score는 무엇을 측정합니까?

silhouette score의 값 범위는 무엇이며 0.7의 점수를 어떻게 해석합니까?

기타 Data Science & ML 면접 주제

Python 기초

Python 객체 지향 프로그래밍

Python 데이터 구조

Git 기초

SQL 기초

NumPy 기초

Pandas 기초

Jupyter & Google Colab

SQL Joins 및 고급 쿼리

Pandas 고급

Matplotlib & Seaborn을 활용한 시각화

Plotly로 만드는 인터랙티브 시각화

기술 통계

추론 통계학

Web Scraping

BigQuery & Cloud Data

Feature Engineering

지도 머신러닝: 회귀

지도 머신러닝: 분류

결정 트리 및 앙상블

ML 파이프라인 및 검증

시계열 및 예측

Deep Learning 기초

TensorFlow & Keras

CNN 및 이미지 분류

RNN 및 시퀀스

Transformers 및 Attention

NLP 및 Hugging Face

GenAI 및 LangChain

MLOps 및 배포

다음 면접을 위해 Data Science & ML을 마스터하세요