Data Science & ML

Unsupervised ML

K-Means, hierarchical clustering, DBSCAN, PCA, t-SNE, UMAP, silhouette score, elbow method

22 คำถามสัมภาษณ์·
Mid-Level
1

อะไรคือความแตกต่างหลักระหว่าง supervised learning และ unsupervised learning?

คำตอบ

Unsupervised learning ทำงานกับข้อมูลที่ไม่มี label โดยพยายามค้นพบโครงสร้างหรือ pattern ที่ซ่อนอยู่โดยไม่มีตัวแปรเป้าหมายที่กำหนดไว้ล่วงหน้า ต่างจาก supervised learning ที่ทำนายค่าที่ทราบ (label) แต่ unsupervised learning จะสำรวจข้อมูลเพื่อหากลุ่มตามธรรมชาติ ลดมิติ หรือตรวจจับความผิดปกติ อัลกอริทึมเช่น K-Means, PCA หรือ DBSCAN เป็นตัวอย่างทั่วไปของ unsupervised learning

2

อัลกอริทึม K-Means ทำงานอย่างไรในการแบ่งข้อมูล?

คำตอบ

K-Means เป็นอัลกอริทึมแบบวนซ้ำที่แบ่งข้อมูลเป็น K cluster โดยจะเริ่มต้น K centroid แบบสุ่ม จากนั้นสลับระหว่างสองขั้นตอน: กำหนดแต่ละจุดให้กับ centroid ที่ใกล้ที่สุด (ขั้นตอน assignment) และคำนวณตำแหน่ง centroid ใหม่เป็นค่าเฉลี่ยของจุดที่กำหนด (ขั้นตอน update) อัลกอริทึมจะ converge เมื่อการกำหนดไม่เปลี่ยนแปลงอีกต่อไปหรือหลังจากจำนวนการวนซ้ำสูงสุด

3

ควรใช้วิธีใดเพื่อกำหนดจำนวน cluster K ที่เหมาะสมที่สุดใน K-Means?

คำตอบ

elbow method พล็อต inertia (ผลรวมระยะทางกำลังสองระหว่างแต่ละจุดและ centroid) เทียบกับ K จุดที่เส้นโค้งสร้างข้อศอกแสดงค่า K ที่เหมาะสมที่สุด เนื่องจากเกินกว่านั้นการเพิ่ม cluster จะไม่ปรับปรุง inertia อย่างมีนัยสำคัญ วิธีนี้เสริมด้วย silhouette score เพื่อตรวจสอบคุณภาพ cluster

4

silhouette score วัดอะไรในบริบทของ clustering?

5

ช่วงค่าของ silhouette score คืออะไรและตีความคะแนน 0.7 อย่างไร?

+19 คำถามสัมภาษณ์

หัวข้อสัมภาษณ์ Data Science & ML อื่นๆ

พื้นฐาน Python

Junior
25 คำถาม

การเขียนโปรแกรมเชิงวัตถุด้วย Python

Junior
20 คำถาม

โครงสร้างข้อมูล Python

Junior
20 คำถาม

พื้นฐาน Git

Junior
18 คำถาม

พื้นฐาน SQL

Junior
20 คำถาม

พื้นฐาน NumPy

Junior
22 คำถาม

พื้นฐาน Pandas

Junior
22 คำถาม

Jupyter & Google Colab

Junior
16 คำถาม

SQL Joins และคิวรีขั้นสูง

Mid-Level
22 คำถาม

Pandas ขั้นสูง

Mid-Level
24 คำถาม

การแสดงผลข้อมูลด้วย Matplotlib & Seaborn

Mid-Level
20 คำถาม

การแสดงผลแบบโต้ตอบด้วย Plotly

Mid-Level
18 คำถาม

สถิติเชิงพรรณนา

Mid-Level
20 คำถาม

สถิติเชิงอนุมาน

Mid-Level
24 คำถาม

Web Scraping

Mid-Level
18 คำถาม

BigQuery & Cloud Data

Mid-Level
18 คำถาม

Feature Engineering

Mid-Level
22 คำถาม

ML แบบมีผู้สอน: การถดถอย

Mid-Level
24 คำถาม

ML แบบมีผู้สอน: การจำแนกประเภท

Mid-Level
24 คำถาม

Decision Trees และ Ensembles

Mid-Level
24 คำถาม

ML Pipelines และการตรวจสอบ

Mid-Level
22 คำถาม

Time Series และการพยากรณ์

Mid-Level
22 คำถาม

พื้นฐาน Deep Learning

Senior
24 คำถาม

TensorFlow & Keras

Senior
22 คำถาม

CNN และการจำแนกภาพ

Senior
24 คำถาม

RNN และซีเควนซ์

Senior
22 คำถาม

Transformers และ Attention

Senior
24 คำถาม

NLP และ Hugging Face

Senior
24 คำถาม

GenAI และ LangChain

Senior
24 คำถาม

MLOps และการ Deploy

Senior
24 คำถาม

เชี่ยวชาญ Data Science & ML สำหรับการสัมภาษณ์ครั้งถัดไป

เข้าถึงคำถามทั้งหมด flashcards แบบทดสอบเทคนิค แบบฝึกหัด code review และตัวจำลองสัมภาษณ์

เริ่มใช้ฟรี