Question 1

เมธอดใดที่ช่วยให้สามารถใช้ฟังก์ชัน aggregation หลายตัวกับคอลัมน์เดียวด้วย groupby?

Accepted Answer

เมธอด agg() (หรือ aggregate()) ช่วยให้สามารถใช้ฟังก์ชัน aggregation หลายตัวกับคอลัมน์เดียวกัน คุณสามารถส่ง list ของฟังก์ชัน เช่น ['sum', 'mean', 'count'] หรือ dictionary เพื่อระบุฟังก์ชันที่แตกต่างกันต่อคอลัมน์ ความยืดหยุ่นนี้จำเป็นสำหรับการสร้างรายงานสถิติที่ครอบคลุมในการดำเนินการครั้งเดียว

Question 2

จะตั้งชื่อคอลัมน์ผลลัพธ์อย่างชัดเจนระหว่างการ aggregation ด้วย groupby โดยใช้ไวยากรณ์ named aggregation ได้อย่างไร?

Accepted Answer

ไวยากรณ์ named aggregation ใช้ agg() กับ named tuple ผ่าน keyword argument เช่น: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')) วิธีนี้สร้างชื่อคอลัมน์ที่ชัดเจนและอ่านง่าย หลีกเลี่ยง MultiIndex ในคอลัมน์ที่อาจทำให้การประมวลผลในภายหลังซับซ้อน

Question 3

อะไรคือความแตกต่างหลักระหว่าง transform() และ apply() ในบริบทของ groupby?

Accepted Answer

transform() คืนค่าผลลัพธ์ที่มีขนาดเดียวกับอินพุต จัดเรียงตาม index เดิม เหมาะสำหรับการเพิ่มสถิติกลุ่มในแต่ละแถว (เช่น ค่าเฉลี่ยของกลุ่ม) apply() ยืดหยุ่นกว่าและสามารถคืนค่าผลลัพธ์ที่มีขนาดต่างกัน แต่โดยทั่วไปช้ากว่า ใช้ transform() สำหรับการดำเนินการ เช่น การ normalize ตามกลุ่มหรือการคำนวณ z-score

Pandas ขั้นสูง

เมธอดใดที่ช่วยให้สามารถใช้ฟังก์ชัน aggregation หลายตัวกับคอลัมน์เดียวด้วย groupby?

คำตอบ

จะตั้งชื่อคอลัมน์ผลลัพธ์อย่างชัดเจนระหว่างการ aggregation ด้วย groupby โดยใช้ไวยากรณ์ named aggregation ได้อย่างไร?

คำตอบ

อะไรคือความแตกต่างหลักระหว่าง transform() และ apply() ในบริบทของ groupby?

คำตอบ

จะกรองกลุ่มใน groupby เพื่อเก็บเฉพาะกลุ่มที่ตรงตามเงื่อนไข (เช่น กลุ่มที่มีมากกว่า 10 องค์ประกอบ) ได้อย่างไร?

อะไรคือความแตกต่างระหว่าง pd.merge() กับ how='left' และ how='inner'?

หัวข้อสัมภาษณ์ Data Science & ML อื่นๆ

พื้นฐาน Python

การเขียนโปรแกรมเชิงวัตถุด้วย Python

โครงสร้างข้อมูล Python

พื้นฐาน Git

พื้นฐาน SQL

พื้นฐาน NumPy

พื้นฐาน Pandas

Jupyter & Google Colab

SQL Joins และคิวรีขั้นสูง

การแสดงผลข้อมูลด้วย Matplotlib & Seaborn

การแสดงผลแบบโต้ตอบด้วย Plotly

สถิติเชิงพรรณนา

สถิติเชิงอนุมาน

Web Scraping

BigQuery & Cloud Data

Feature Engineering

ML แบบมีผู้สอน: การถดถอย

ML แบบมีผู้สอน: การจำแนกประเภท

Decision Trees และ Ensembles

Unsupervised ML

ML Pipelines และการตรวจสอบ

Time Series และการพยากรณ์

พื้นฐาน Deep Learning

TensorFlow & Keras

CNN และการจำแนกภาพ

RNN และซีเควนซ์

Transformers และ Attention

NLP และ Hugging Face

GenAI และ LangChain

MLOps และการ Deploy

เชี่ยวชาญ Data Science & ML สำหรับการสัมภาษณ์ครั้งถัดไป