
Pandas nâng cao
GroupBy, merge, concat, pivot tables, time series, apply/transform, MultiIndex, hiệu năng
1Phương thức nào cho phép áp dụng nhiều hàm tổng hợp khác nhau cho một cột duy nhất với groupby?
Phương thức nào cho phép áp dụng nhiều hàm tổng hợp khác nhau cho một cột duy nhất với groupby?
Câu trả lời
Phương thức agg() (hoặc aggregate()) cho phép áp dụng nhiều hàm tổng hợp cho cùng các cột. Bạn có thể truyền một danh sách các hàm như ['sum', 'mean', 'count'] hoặc một dictionary để chỉ định các hàm khác nhau cho từng cột. Sự linh hoạt này rất cần thiết để tạo các báo cáo thống kê toàn diện trong một thao tác duy nhất.
2Làm thế nào để đặt tên rõ ràng cho các cột kết quả trong quá trình tổng hợp groupby sử dụng cú pháp named aggregation?
Làm thế nào để đặt tên rõ ràng cho các cột kết quả trong quá trình tổng hợp groupby sử dụng cú pháp named aggregation?
Câu trả lời
Cú pháp named aggregation sử dụng agg() với các tuple được đặt tên thông qua keyword argument. Ví dụ: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')). Cách tiếp cận này tạo ra tên cột rõ ràng và dễ đọc, tránh MultiIndex trong các cột có thể làm phức tạp việc xử lý tiếp theo.
3Sự khác biệt chính giữa transform() và apply() trong ngữ cảnh groupby là gì?
Sự khác biệt chính giữa transform() và apply() trong ngữ cảnh groupby là gì?
Câu trả lời
transform() trả về kết quả có cùng kích thước với đầu vào, được căn chỉnh theo chỉ mục gốc, lý tưởng để thêm thống kê nhóm vào từng hàng (ví dụ: trung bình nhóm). apply() linh hoạt hơn và có thể trả về kết quả có kích thước khác, nhưng thường chậm hơn. Sử dụng transform() cho các thao tác như chuẩn hóa nhóm hoặc tính toán z-score.
Làm thế nào để lọc các nhóm trong groupby để chỉ giữ những nhóm thỏa mãn điều kiện (ví dụ: nhóm có hơn 10 phần tử)?
Sự khác biệt giữa pd.merge() với how='left' và how='inner' là gì?
+21 câu hỏi phỏng vấn
Các chủ đề phỏng vấn Data Science & ML khác
Cơ bản về Python
Lập trình Hướng đối tượng Python
Cấu trúc dữ liệu Python
Kiến Thức Cơ Bản về Git
Cơ bản về SQL
Kiến thức cơ bản về NumPy
Cơ bản về Pandas
Jupyter & Google Colab
SQL Joins & Truy vấn nâng cao
Trực quan hóa với Matplotlib & Seaborn
Trực quan hóa tương tác với Plotly
Thống kê mô tả
Thống kê suy luận
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML Có Giám Sát: Hồi Quy
ML Có Giám Sát: Phân Loại
Cây Quyết định & Ensemble
ML Không Giám Sát
Pipeline ML & Xác thực
Chuỗi thời gian & Dự báo
Cơ Bản Về Deep Learning
TensorFlow & Keras
CNN và phân loại hình ảnh
RNN & Chuỗi
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps và Triển khai
Nắm vững Data Science & ML cho lần phỏng vấn tiếp theo
Truy cập tất cả câu hỏi, flashcards, bài kiểm tra kỹ thuật, bài tập code review và mô phỏng phỏng vấn.
Bắt đầu miễn phí