
Unsupervised ML
K-Means, hierarchical clustering, DBSCAN, PCA, t-SNE, UMAP, silhouette score, elbow method
1อะไรคือความแตกต่างหลักระหว่าง supervised learning และ unsupervised learning?
อะไรคือความแตกต่างหลักระหว่าง supervised learning และ unsupervised learning?
คำตอบ
Unsupervised learning ทำงานกับข้อมูลที่ไม่มี label โดยพยายามค้นพบโครงสร้างหรือ pattern ที่ซ่อนอยู่โดยไม่มีตัวแปรเป้าหมายที่กำหนดไว้ล่วงหน้า ต่างจาก supervised learning ที่ทำนายค่าที่ทราบ (label) แต่ unsupervised learning จะสำรวจข้อมูลเพื่อหากลุ่มตามธรรมชาติ ลดมิติ หรือตรวจจับความผิดปกติ อัลกอริทึมเช่น K-Means, PCA หรือ DBSCAN เป็นตัวอย่างทั่วไปของ unsupervised learning
2อัลกอริทึม K-Means ทำงานอย่างไรในการแบ่งข้อมูล?
อัลกอริทึม K-Means ทำงานอย่างไรในการแบ่งข้อมูล?
คำตอบ
K-Means เป็นอัลกอริทึมแบบวนซ้ำที่แบ่งข้อมูลเป็น K cluster โดยจะเริ่มต้น K centroid แบบสุ่ม จากนั้นสลับระหว่างสองขั้นตอน: กำหนดแต่ละจุดให้กับ centroid ที่ใกล้ที่สุด (ขั้นตอน assignment) และคำนวณตำแหน่ง centroid ใหม่เป็นค่าเฉลี่ยของจุดที่กำหนด (ขั้นตอน update) อัลกอริทึมจะ converge เมื่อการกำหนดไม่เปลี่ยนแปลงอีกต่อไปหรือหลังจากจำนวนการวนซ้ำสูงสุด
3ควรใช้วิธีใดเพื่อกำหนดจำนวน cluster K ที่เหมาะสมที่สุดใน K-Means?
ควรใช้วิธีใดเพื่อกำหนดจำนวน cluster K ที่เหมาะสมที่สุดใน K-Means?
คำตอบ
elbow method พล็อต inertia (ผลรวมระยะทางกำลังสองระหว่างแต่ละจุดและ centroid) เทียบกับ K จุดที่เส้นโค้งสร้างข้อศอกแสดงค่า K ที่เหมาะสมที่สุด เนื่องจากเกินกว่านั้นการเพิ่ม cluster จะไม่ปรับปรุง inertia อย่างมีนัยสำคัญ วิธีนี้เสริมด้วย silhouette score เพื่อตรวจสอบคุณภาพ cluster
silhouette score วัดอะไรในบริบทของ clustering?
ช่วงค่าของ silhouette score คืออะไรและตีความคะแนน 0.7 อย่างไร?
+19 คำถามสัมภาษณ์
หัวข้อสัมภาษณ์ Data Science & ML อื่นๆ
พื้นฐาน Python
การเขียนโปรแกรมเชิงวัตถุด้วย Python
โครงสร้างข้อมูล Python
พื้นฐาน Git
พื้นฐาน SQL
พื้นฐาน NumPy
พื้นฐาน Pandas
Jupyter & Google Colab
SQL Joins และคิวรีขั้นสูง
Pandas ขั้นสูง
การแสดงผลข้อมูลด้วย Matplotlib & Seaborn
การแสดงผลแบบโต้ตอบด้วย Plotly
สถิติเชิงพรรณนา
สถิติเชิงอนุมาน
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML แบบมีผู้สอน: การถดถอย
ML แบบมีผู้สอน: การจำแนกประเภท
Decision Trees และ Ensembles
ML Pipelines และการตรวจสอบ
Time Series และการพยากรณ์
พื้นฐาน Deep Learning
TensorFlow & Keras
CNN และการจำแนกภาพ
RNN และซีเควนซ์
Transformers และ Attention
NLP และ Hugging Face
GenAI และ LangChain
MLOps และการ Deploy
เชี่ยวชาญ Data Science & ML สำหรับการสัมภาษณ์ครั้งถัดไป
เข้าถึงคำถามทั้งหมด flashcards แบบทดสอบเทคนิค แบบฝึกหัด code review และตัวจำลองสัมภาษณ์
เริ่มใช้ฟรี