Data Science & ML

Decision Trees และ Ensembles

Decision Trees, Random Forest, Gradient Boosting, XGBoost, การปรับ hyperparameter, feature importance

24 คำถามสัมภาษณ์·
Mid-Level
1

Decision tree ใน Machine Learning คืออะไร?

คำตอบ

Decision tree เป็นโมเดล Machine Learning ที่ทำการทำนายโดยการแบ่งข้อมูลตามกฎการตัดสินใจแบบลำดับชั้น แต่ละ internal node แสดงถึงการทดสอบบน feature แต่ละกิ่งแสดงถึงผลลัพธ์ของการทดสอบ และแต่ละ leaf แสดงถึงการทำนายขั้นสุดท้าย โมเดลนี้เข้าใจง่ายและตีความได้ง่าย ทำให้เป็นทางเลือกที่ดีเยี่ยมในการทำความเข้าใจปัจจัยที่มีอิทธิพลต่อการตัดสินใจ

2

เกณฑ์ใดถูกใช้เป็นค่าเริ่มต้นใน scikit-learn เพื่อวัดคุณภาพของ split ใน classification tree?

คำตอบ

Gini index คือเกณฑ์เริ่มต้นใน scikit-learn สำหรับ classification trees มันวัดความไม่บริสุทธิ์ของ node โดยการคำนวณความน่าจะเป็นที่องค์ประกอบจะถูกจัดประเภทผิดหากถูกจัดประเภทแบบสุ่มตามการกระจายของคลาส Gini เท่ากับ 0 หมายถึง node บริสุทธิ์ (คลาสเดียว) ในขณะที่ Gini สูงกว่าบ่งบอกถึงความหลากหลายของคลาสที่มากขึ้น

3

ความแตกต่างหลักระหว่าง Gini index และ entropy ในฐานะเกณฑ์ split คืออะไร?

คำตอบ

Gini index และ entropy โดยทั่วไปสร้าง tree ที่คล้ายกันมาก แต่ Gini คำนวณได้เร็วกว่าเล็กน้อยเนื่องจากไม่ต้องการการคำนวณ logarithm Entropy ซึ่งอิงตามทฤษฎีข้อมูล บางครั้งอาจสร้าง split ที่สมดุลมากขึ้นเล็กน้อย ในทางปฏิบัติ การเลือกระหว่างทั้งสองนี้ไม่ค่อยมีผลกระทบที่สำคัญต่อประสิทธิภาพของโมเดล

4

Pruning ในบริบทของ decision trees คืออะไร?

5

Hyperparameter ใดควบคุมความลึกสูงสุดของ decision tree ใน scikit-learn?

+21 คำถามสัมภาษณ์

หัวข้อสัมภาษณ์ Data Science & ML อื่นๆ

พื้นฐาน Python

Junior
25 คำถาม

การเขียนโปรแกรมเชิงวัตถุด้วย Python

Junior
20 คำถาม

โครงสร้างข้อมูล Python

Junior
20 คำถาม

พื้นฐาน Git

Junior
18 คำถาม

พื้นฐาน SQL

Junior
20 คำถาม

พื้นฐาน NumPy

Junior
22 คำถาม

พื้นฐาน Pandas

Junior
22 คำถาม

Jupyter & Google Colab

Junior
16 คำถาม

SQL Joins และคิวรีขั้นสูง

Mid-Level
22 คำถาม

Pandas ขั้นสูง

Mid-Level
24 คำถาม

การแสดงผลข้อมูลด้วย Matplotlib & Seaborn

Mid-Level
20 คำถาม

การแสดงผลแบบโต้ตอบด้วย Plotly

Mid-Level
18 คำถาม

สถิติเชิงพรรณนา

Mid-Level
20 คำถาม

สถิติเชิงอนุมาน

Mid-Level
24 คำถาม

Web Scraping

Mid-Level
18 คำถาม

BigQuery & Cloud Data

Mid-Level
18 คำถาม

Feature Engineering

Mid-Level
22 คำถาม

ML แบบมีผู้สอน: การถดถอย

Mid-Level
24 คำถาม

ML แบบมีผู้สอน: การจำแนกประเภท

Mid-Level
24 คำถาม

Unsupervised ML

Mid-Level
22 คำถาม

ML Pipelines และการตรวจสอบ

Mid-Level
22 คำถาม

Time Series และการพยากรณ์

Mid-Level
22 คำถาม

พื้นฐาน Deep Learning

Senior
24 คำถาม

TensorFlow & Keras

Senior
22 คำถาม

CNN และการจำแนกภาพ

Senior
24 คำถาม

RNN และซีเควนซ์

Senior
22 คำถาม

Transformers และ Attention

Senior
24 คำถาม

NLP และ Hugging Face

Senior
24 คำถาม

GenAI และ LangChain

Senior
24 คำถาม

MLOps และการ Deploy

Senior
24 คำถาม

เชี่ยวชาญ Data Science & ML สำหรับการสัมภาษณ์ครั้งถัดไป

เข้าถึงคำถามทั้งหมด flashcards แบบทดสอบเทคนิค แบบฝึกหัด code review และตัวจำลองสัมภาษณ์

เริ่มใช้ฟรี