Data Science & ML

決定木とアンサンブル

Decision Trees、Random Forest、Gradient Boosting、XGBoost、ハイパーパラメータチューニング、feature importance

24 面接問題·
Mid-Level
1

Machine Learningにおける decision tree とは何ですか?

回答

Decision treeは、階層的な決定ルールに従ってデータを分割することで予測を行うMachine Learningモデルです。各内部ノードは特徴量に対するテストを表し、各ブランチはテストの結果を表し、各リーフは最終的な予測を表します。このモデルは直感的で解釈が容易であり、決定に影響を与える要因を理解するための優れた選択肢となります。

2

scikit-learnでclassification treeのsplitの品質を測定するために、デフォルトでどの基準が使用されますか?

回答

Gini indexは、classification treeのscikit-learnにおけるデフォルト基準です。クラス分布に従ってランダムに分類された場合に要素が誤分類される確率を計算することで、ノードの不純度を測定します。Giniが0であれば純粋なノード(単一クラス)を意味し、Giniが高いほどクラスの多様性が大きいことを示します。

3

splitの基準としてのGini indexとエントロピーの主な違いは何ですか?

回答

Gini indexとエントロピーは通常非常に似たツリーを生成しますが、Giniは対数計算が不要なため計算がわずかに高速です。情報理論に基づくエントロピーは、時にはわずかにバランスの取れたsplitを作成することがあります。実際には、両者の選択がモデルのパフォーマンスに大きな影響を与えることはほとんどありません。

4

decision treeにおけるpruningとは何ですか?

5

scikit-learnでdecision treeの最大深度を制御するハイパーパラメータはどれですか?

+21 面接問題

次の面接に向けてData Science & MLをマスター

すべての問題、flashcards、技術テスト、コードレビュー演習、面接シミュレーターにアクセス。

無料で始める