Data Science & ML

教師なしML

K-Means、階層的クラスタリング、DBSCAN、PCA、t-SNE、UMAP、silhouette score、elbow method

22 面接問題·
Mid-Level
1

教師あり学習と教師なし学習の主な違いは何ですか?

回答

教師なし学習はラベルのないデータを扱い、事前定義されたターゲット変数なしに隠れた構造やパターンを発見しようとします。既知の値(ラベル)を予測する教師あり学習とは異なり、教師なし学習はデータを探索して自然なグループを見つけたり、次元を削減したり、異常を検出したりします。K-Means、PCA、DBSCANなどのアルゴリズムは教師なし学習の典型例です。

2

K-Meansアルゴリズムはデータを分割するためにどのように動作しますか?

回答

K-Meansは、データをKクラスターに分割する反復アルゴリズムです。K個のセントロイドをランダムに初期化し、2つのステップを交互に行います:各点を最も近いセントロイドに割り当て(割り当てステップ)、割り当てられた点の平均としてセントロイドの位置を再計算します(更新ステップ)。アルゴリズムは、割り当てが変化しなくなったとき、または最大反復回数に達したときに収束します。

3

K-Meansで最適なクラスター数Kを決定するためにどの方法を使用しますか?

回答

elbow methodは、慣性(各点とそのセントロイド間の距離の二乗和)をKに対してプロットします。曲線がエルボーを形成する点が最適なKを示します。それを超えてクラスターを追加しても慣性はそれほど改善しません。この方法はsilhouette scoreで補完され、クラスターの品質を検証します。

4

クラスタリングの文脈でsilhouette scoreは何を測定しますか?

5

silhouette scoreの値の範囲は何で、0.7のスコアをどう解釈しますか?

+19 面接問題

次の面接に向けてData Science & MLをマスター

すべての問題、flashcards、技術テスト、コードレビュー演習、面接シミュレーターにアクセス。

無料で始める