Data Analytics

Python & Pandas - Cơ bản

DataFrame, Series, lập chỉ mục (loc, iloc), lọc boolean, kiểu dữ liệu, read_csv, describe, info, head/tail, shape, columns

20 câu hỏi phỏng vấn·
Junior
1

Cấu trúc dữ liệu chính của Pandas để lưu trữ dữ liệu dạng bảng là gì?

Câu trả lời

DataFrame là cấu trúc dữ liệu cốt lõi của Pandas. Nó đại diện cho một bảng hai chiều với các hàng và cột, tương tự như spreadsheet hoặc bảng SQL. Mỗi cột là một Series, và mỗi hàng có một index. DataFrame cho phép thao tác hiệu quả với dữ liệu có cấu trúc thông qua nhiều phương thức tích hợp sẵn.

2

Series trong Pandas là gì?

Câu trả lời

Series là một mảng một chiều có index. Nó đại diện cho một cột dữ liệu duy nhất trong DataFrame. Mỗi phần tử có một nhãn (index) cho phép truy cập nhanh theo tên hoặc vị trí. Series chỉ có thể chứa một kiểu dữ liệu (int, float, string, v.v.), điều này phân biệt nó với một list Python thông thường.

3

Hàm Pandas nào đọc file CSV và tải nó vào DataFrame?

Câu trả lời

Hàm pd.read_csv() đọc file CSV và trả về một DataFrame. Nó chấp nhận nhiều tham số: sep cho dấu phân cách, header cho hàng tiêu đề, encoding cho mã hóa file, dtype để buộc kiểu cột, và na_values để định nghĩa giá trị bị thiếu. Đây là phương pháp phổ biến nhất để nhập dữ liệu vào Pandas.

4

Thuộc tính df.shape trả về cái gì trên một DataFrame?

5

Phương thức nào hiển thị 5 hàng đầu tiên của DataFrame?

+17 câu hỏi phỏng vấn

Nắm vững Data Analytics cho lần phỏng vấn tiếp theo

Truy cập tất cả câu hỏi, flashcards, bài kiểm tra kỹ thuật, bài tập code review và mô phỏng phỏng vấn.

Bắt đầu miễn phí