Data Science & ML

Cơ bản về Pandas

DataFrames, Series, lập chỉ mục, lựa chọn, lọc, giá trị thiếu, kiểu dữ liệu

22 câu hỏi phỏng vấn·
Junior
1

Cấu trúc dữ liệu chính của Pandas để lưu trữ dữ liệu dạng bảng với các hàng và cột được đặt tên là gì?

Câu trả lời

DataFrame là cấu trúc dữ liệu trung tâm của Pandas, được thiết kế để lưu trữ dữ liệu dạng bảng hai chiều. Mỗi cột có thể chứa một kiểu dữ liệu khác nhau, và cả hàng và cột đều có nhãn (index). Cấu trúc này tương tự như bảng tính Excel hoặc bảng SQL, giúp dễ dàng thao tác với dữ liệu có cấu trúc.

2

Cấu trúc Pandas nào đại diện cho một cột dữ liệu duy nhất với một chỉ mục?

Câu trả lời

Series là một cấu trúc một chiều có thể chứa bất kỳ kiểu dữ liệu nào (số nguyên, chuỗi, số thực, đối tượng Python). Mỗi phần tử có một chỉ mục liên kết, cho phép truy cập giá trị theo nhãn của chúng. Một cột được trích xuất từ DataFrame sẽ tự động được chuyển đổi thành Series.

3

Làm thế nào để tạo DataFrame từ một dictionary Python trong đó các khóa trở thành tên cột?

Câu trả lời

Hàm pd.DataFrame() trực tiếp chấp nhận một dictionary Python. Các khóa của dictionary tự động trở thành tên cột và các giá trị (danh sách hoặc mảng) trở thành dữ liệu của mỗi cột. Phương pháp này là cách phổ biến nhất để tạo DataFrame từ dữ liệu có cấu trúc trong Python.

4

Phương thức nào nên được sử dụng để đọc tệp CSV và tải vào DataFrame?

5

Phương thức nào hiển thị các hàng đầu tiên của DataFrame để xem trước dữ liệu nhanh?

+19 câu hỏi phỏng vấn

Nắm vững Data Science & ML cho lần phỏng vấn tiếp theo

Truy cập tất cả câu hỏi, flashcards, bài kiểm tra kỹ thuật, bài tập code review và mô phỏng phỏng vấn.

Bắt đầu miễn phí