Data Analytics

Python Analytics - Phân tích nâng cao và ML

groupby, merge, pivot_table, apply/map, Plotly, Scikit-Learn (hồi quy, phân loại, clustering), train/test split, các chỉ số, Jupyter, Google Colab

20 câu hỏi phỏng vấn·
Senior
1

Sự khác biệt chính giữa các phương thức apply() và map() trên Pandas Series là gì?

Câu trả lời

Phương thức map() được thiết kế để ánh xạ mỗi giá trị trong Series thành giá trị mới bằng cách sử dụng dictionary hoặc hàm, và chỉ hoạt động trên Series. Ngược lại, apply() linh hoạt hơn: nó có thể áp dụng một hàm theo từng phần tử trên Series hoặc theo từng hàng/cột trên DataFrame. Đối với các phép biến đổi giá trị đơn giản trên Series, map() thường nhanh hơn và dễ đọc hơn.

2

Phương thức Pandas nào nên được sử dụng để tổng hợp dữ liệu với nhiều hàm tổng hợp trên các cột khác nhau cùng lúc?

Câu trả lời

Phương thức agg() (hoặc aggregate()) cho phép áp dụng các hàm tổng hợp khác nhau cho các cột khác nhau trong một thao tác duy nhất. Nó chấp nhận một dictionary trong đó key là tên cột và value là các hàm cần áp dụng. Cách tiếp cận này hiệu quả và dễ đọc hơn so với việc xâu chuỗi nhiều lệnh gọi groupby với các hàm riêng lẻ.

3

Sự khác biệt giữa merge() và join() trong Pandas là gì?

Câu trả lời

merge() là một hàm linh hoạt hơn nối hai DataFrame trên các cột cụ thể bằng cách sử dụng tham số on, left_on/right_on, hoặc các index. join() là một phương thức DataFrame nối trên các index theo mặc định và súc tích hơn cho các phép nối đơn giản dựa trên index. Đối với các phép nối phức tạp trên các cột không phải index, merge() được ưu tiên hơn vì nó cung cấp nhiều quyền kiểm soát hơn đối với các cột nối.

4

Làm thế nào để tạo một bảng pivot với pivot_table() chỉ định nhiều hàm tổng hợp?

5

Mục đích của transform() trong ngữ cảnh groupby() so với apply() là gì?

+17 câu hỏi phỏng vấn

Nắm vững Data Analytics cho lần phỏng vấn tiếp theo

Truy cập tất cả câu hỏi, flashcards, bài kiểm tra kỹ thuật, bài tập code review và mô phỏng phỏng vấn.

Bắt đầu miễn phí