
教師なしML
K-Means、階層的クラスタリング、DBSCAN、PCA、t-SNE、UMAP、silhouette score、elbow method
22 面接問題·
Mid-Level
1教師あり学習と教師なし学習の主な違いは何ですか?
1
教師あり学習と教師なし学習の主な違いは何ですか?
回答
教師なし学習はラベルのないデータを扱い、事前定義されたターゲット変数なしに隠れた構造やパターンを発見しようとします。既知の値(ラベル)を予測する教師あり学習とは異なり、教師なし学習はデータを探索して自然なグループを見つけたり、次元を削減したり、異常を検出したりします。K-Means、PCA、DBSCANなどのアルゴリズムは教師なし学習の典型例です。
2K-Meansアルゴリズムはデータを分割するためにどのように動作しますか?
2
K-Meansアルゴリズムはデータを分割するためにどのように動作しますか?
回答
K-Meansは、データをKクラスターに分割する反復アルゴリズムです。K個のセントロイドをランダムに初期化し、2つのステップを交互に行います:各点を最も近いセントロイドに割り当て(割り当てステップ)、割り当てられた点の平均としてセントロイドの位置を再計算します(更新ステップ)。アルゴリズムは、割り当てが変化しなくなったとき、または最大反復回数に達したときに収束します。
3K-Meansで最適なクラスター数Kを決定するためにどの方法を使用しますか?
3
K-Meansで最適なクラスター数Kを決定するためにどの方法を使用しますか?
回答
elbow methodは、慣性(各点とそのセントロイド間の距離の二乗和)をKに対してプロットします。曲線がエルボーを形成する点が最適なKを示します。それを超えてクラスターを追加しても慣性はそれほど改善しません。この方法はsilhouette scoreで補完され、クラスターの品質を検証します。
4
クラスタリングの文脈でsilhouette scoreは何を測定しますか?
5
silhouette scoreの値の範囲は何で、0.7のスコアをどう解釈しますか?
+19 面接問題
その他のData Science & ML面接トピック
Pythonの基礎
Junior
25問Pythonオブジェクト指向プログラミング
Junior
20問Pythonのデータ構造
Junior
20問Git の基礎
Junior
18問SQLの基礎
Junior
20問NumPyの基礎
Junior
22問Pandasの基礎
Junior
22問Jupyter & Google Colab
Junior
16問SQL Joinsと高度なクエリ
Mid-Level
22問Pandas応用
Mid-Level
24問Matplotlib & Seabornによる可視化
Mid-Level
20問Plotlyによるインタラクティブな可視化
Mid-Level
18問記述統計
Mid-Level
20問推測統計学
Mid-Level
24問Web Scraping
Mid-Level
18問BigQuery & Cloud Data
Mid-Level
18問Feature Engineering
Mid-Level
22問教師あり機械学習:回帰
Mid-Level
24問教師あり機械学習:分類
Mid-Level
24問決定木とアンサンブル
Mid-Level
24問MLパイプラインと検証
Mid-Level
22問時系列と予測
Mid-Level
22問Deep Learningの基礎
Senior
24問TensorFlow & Keras
Senior
22問CNN と画像分類
Senior
24問RNNとシーケンス
Senior
22問TransformersとAttention
Senior
24問NLPとHugging Face
Senior
24問GenAIとLangChain
Senior
24問MLOps とデプロイ
Senior
24問