
決定木とアンサンブル
Decision Trees、Random Forest、Gradient Boosting、XGBoost、ハイパーパラメータチューニング、feature importance
24 面接問題·
Mid-Level
1Machine Learningにおける decision tree とは何ですか?
1
Machine Learningにおける decision tree とは何ですか?
回答
Decision treeは、階層的な決定ルールに従ってデータを分割することで予測を行うMachine Learningモデルです。各内部ノードは特徴量に対するテストを表し、各ブランチはテストの結果を表し、各リーフは最終的な予測を表します。このモデルは直感的で解釈が容易であり、決定に影響を与える要因を理解するための優れた選択肢となります。
2scikit-learnでclassification treeのsplitの品質を測定するために、デフォルトでどの基準が使用されますか?
2
scikit-learnでclassification treeのsplitの品質を測定するために、デフォルトでどの基準が使用されますか?
回答
Gini indexは、classification treeのscikit-learnにおけるデフォルト基準です。クラス分布に従ってランダムに分類された場合に要素が誤分類される確率を計算することで、ノードの不純度を測定します。Giniが0であれば純粋なノード(単一クラス)を意味し、Giniが高いほどクラスの多様性が大きいことを示します。
3splitの基準としてのGini indexとエントロピーの主な違いは何ですか?
3
splitの基準としてのGini indexとエントロピーの主な違いは何ですか?
回答
Gini indexとエントロピーは通常非常に似たツリーを生成しますが、Giniは対数計算が不要なため計算がわずかに高速です。情報理論に基づくエントロピーは、時にはわずかにバランスの取れたsplitを作成することがあります。実際には、両者の選択がモデルのパフォーマンスに大きな影響を与えることはほとんどありません。
4
decision treeにおけるpruningとは何ですか?
5
scikit-learnでdecision treeの最大深度を制御するハイパーパラメータはどれですか?
+21 面接問題
その他のData Science & ML面接トピック
Pythonの基礎
Junior
25問Pythonオブジェクト指向プログラミング
Junior
20問Pythonのデータ構造
Junior
20問Git の基礎
Junior
18問SQLの基礎
Junior
20問NumPyの基礎
Junior
22問Pandasの基礎
Junior
22問Jupyter & Google Colab
Junior
16問SQL Joinsと高度なクエリ
Mid-Level
22問Pandas応用
Mid-Level
24問Matplotlib & Seabornによる可視化
Mid-Level
20問Plotlyによるインタラクティブな可視化
Mid-Level
18問記述統計
Mid-Level
20問推測統計学
Mid-Level
24問Web Scraping
Mid-Level
18問BigQuery & Cloud Data
Mid-Level
18問Feature Engineering
Mid-Level
22問教師あり機械学習:回帰
Mid-Level
24問教師あり機械学習:分類
Mid-Level
24問教師なしML
Mid-Level
22問MLパイプラインと検証
Mid-Level
22問時系列と予測
Mid-Level
22問Deep Learningの基礎
Senior
24問TensorFlow & Keras
Senior
22問CNN と画像分類
Senior
24問RNNとシーケンス
Senior
22問TransformersとAttention
Senior
24問NLPとHugging Face
Senior
24問GenAIとLangChain
Senior
24問MLOps とデプロイ
Senior
24問