
Pandas ขั้นสูง
GroupBy, merge, concat, pivot tables, time series, apply/transform, MultiIndex, ประสิทธิภาพ
1เมธอดใดที่ช่วยให้สามารถใช้ฟังก์ชัน aggregation หลายตัวกับคอลัมน์เดียวด้วย groupby?
เมธอดใดที่ช่วยให้สามารถใช้ฟังก์ชัน aggregation หลายตัวกับคอลัมน์เดียวด้วย groupby?
คำตอบ
เมธอด agg() (หรือ aggregate()) ช่วยให้สามารถใช้ฟังก์ชัน aggregation หลายตัวกับคอลัมน์เดียวกัน คุณสามารถส่ง list ของฟังก์ชัน เช่น ['sum', 'mean', 'count'] หรือ dictionary เพื่อระบุฟังก์ชันที่แตกต่างกันต่อคอลัมน์ ความยืดหยุ่นนี้จำเป็นสำหรับการสร้างรายงานสถิติที่ครอบคลุมในการดำเนินการครั้งเดียว
2จะตั้งชื่อคอลัมน์ผลลัพธ์อย่างชัดเจนระหว่างการ aggregation ด้วย groupby โดยใช้ไวยากรณ์ named aggregation ได้อย่างไร?
จะตั้งชื่อคอลัมน์ผลลัพธ์อย่างชัดเจนระหว่างการ aggregation ด้วย groupby โดยใช้ไวยากรณ์ named aggregation ได้อย่างไร?
คำตอบ
ไวยากรณ์ named aggregation ใช้ agg() กับ named tuple ผ่าน keyword argument เช่น: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')) วิธีนี้สร้างชื่อคอลัมน์ที่ชัดเจนและอ่านง่าย หลีกเลี่ยง MultiIndex ในคอลัมน์ที่อาจทำให้การประมวลผลในภายหลังซับซ้อน
3อะไรคือความแตกต่างหลักระหว่าง transform() และ apply() ในบริบทของ groupby?
อะไรคือความแตกต่างหลักระหว่าง transform() และ apply() ในบริบทของ groupby?
คำตอบ
transform() คืนค่าผลลัพธ์ที่มีขนาดเดียวกับอินพุต จัดเรียงตาม index เดิม เหมาะสำหรับการเพิ่มสถิติกลุ่มในแต่ละแถว (เช่น ค่าเฉลี่ยของกลุ่ม) apply() ยืดหยุ่นกว่าและสามารถคืนค่าผลลัพธ์ที่มีขนาดต่างกัน แต่โดยทั่วไปช้ากว่า ใช้ transform() สำหรับการดำเนินการ เช่น การ normalize ตามกลุ่มหรือการคำนวณ z-score
จะกรองกลุ่มใน groupby เพื่อเก็บเฉพาะกลุ่มที่ตรงตามเงื่อนไข (เช่น กลุ่มที่มีมากกว่า 10 องค์ประกอบ) ได้อย่างไร?
อะไรคือความแตกต่างระหว่าง pd.merge() กับ how='left' และ how='inner'?
+21 คำถามสัมภาษณ์
หัวข้อสัมภาษณ์ Data Science & ML อื่นๆ
พื้นฐาน Python
การเขียนโปรแกรมเชิงวัตถุด้วย Python
โครงสร้างข้อมูล Python
พื้นฐาน Git
พื้นฐาน SQL
พื้นฐาน NumPy
พื้นฐาน Pandas
Jupyter & Google Colab
SQL Joins และคิวรีขั้นสูง
การแสดงผลข้อมูลด้วย Matplotlib & Seaborn
การแสดงผลแบบโต้ตอบด้วย Plotly
สถิติเชิงพรรณนา
สถิติเชิงอนุมาน
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML แบบมีผู้สอน: การถดถอย
ML แบบมีผู้สอน: การจำแนกประเภท
Decision Trees และ Ensembles
Unsupervised ML
ML Pipelines และการตรวจสอบ
Time Series และการพยากรณ์
พื้นฐาน Deep Learning
TensorFlow & Keras
CNN และการจำแนกภาพ
RNN และซีเควนซ์
Transformers และ Attention
NLP และ Hugging Face
GenAI และ LangChain
MLOps และการ Deploy
เชี่ยวชาญ Data Science & ML สำหรับการสัมภาษณ์ครั้งถัดไป
เข้าถึงคำถามทั้งหมด flashcards แบบทดสอบเทคนิค แบบฝึกหัด code review และตัวจำลองสัมภาษณ์
เริ่มใช้ฟรี