Question 1

教師あり学習と教師なし学習の主な違いは何ですか？

Accepted Answer

教師なし学習はラベルのないデータを扱い、事前定義されたターゲット変数なしに隠れた構造やパターンを発見しようとします。既知の値（ラベル）を予測する教師あり学習とは異なり、教師なし学習はデータを探索して自然なグループを見つけたり、次元を削減したり、異常を検出したりします。K-Means、PCA、DBSCANなどのアルゴリズムは教師なし学習の典型例です。

Question 2

K-Meansアルゴリズムはデータを分割するためにどのように動作しますか？

Accepted Answer

K-Meansは、データをKクラスターに分割する反復アルゴリズムです。K個のセントロイドをランダムに初期化し、2つのステップを交互に行います：各点を最も近いセントロイドに割り当て（割り当てステップ）、割り当てられた点の平均としてセントロイドの位置を再計算します（更新ステップ）。アルゴリズムは、割り当てが変化しなくなったとき、または最大反復回数に達したときに収束します。

Question 3

K-Meansで最適なクラスター数Kを決定するためにどの方法を使用しますか？

Accepted Answer

elbow methodは、慣性（各点とそのセントロイド間の距離の二乗和）をKに対してプロットします。曲線がエルボーを形成する点が最適なKを示します。それを超えてクラスターを追加しても慣性はそれほど改善しません。この方法はsilhouette scoreで補完され、クラスターの品質を検証します。

教師なしML

教師あり学習と教師なし学習の主な違いは何ですか？

回答

K-Meansアルゴリズムはデータを分割するためにどのように動作しますか？

回答

K-Meansで最適なクラスター数Kを決定するためにどの方法を使用しますか？

回答

クラスタリングの文脈でsilhouette scoreは何を測定しますか？

silhouette scoreの値の範囲は何で、0.7のスコアをどう解釈しますか？

その他のData Science & ML面接トピック

Pythonの基礎

Pythonオブジェクト指向プログラミング

Pythonのデータ構造

Git の基礎

SQLの基礎

NumPyの基礎

Pandasの基礎

Jupyter & Google Colab

SQL Joinsと高度なクエリ

Pandas応用

Matplotlib & Seabornによる可視化

Plotlyによるインタラクティブな可視化

記述統計

推測統計学

Web Scraping

BigQuery & Cloud Data

Feature Engineering

教師あり機械学習：回帰

教師あり機械学習：分類

決定木とアンサンブル

MLパイプラインと検証

時系列と予測

Deep Learningの基礎

TensorFlow & Keras

CNN と画像分類

RNNとシーケンス

TransformersとAttention

NLPとHugging Face

GenAIとLangChain

MLOps とデプロイ

次の面接に向けてData Science & MLをマスター