
Python & Pandas - Cơ bản
DataFrame, Series, lập chỉ mục (loc, iloc), lọc boolean, kiểu dữ liệu, read_csv, describe, info, head/tail, shape, columns
1Cấu trúc dữ liệu chính của Pandas để lưu trữ dữ liệu dạng bảng là gì?
Cấu trúc dữ liệu chính của Pandas để lưu trữ dữ liệu dạng bảng là gì?
Câu trả lời
DataFrame là cấu trúc dữ liệu cốt lõi của Pandas. Nó đại diện cho một bảng hai chiều với các hàng và cột, tương tự như spreadsheet hoặc bảng SQL. Mỗi cột là một Series, và mỗi hàng có một index. DataFrame cho phép thao tác hiệu quả với dữ liệu có cấu trúc thông qua nhiều phương thức tích hợp sẵn.
2Series trong Pandas là gì?
Series trong Pandas là gì?
Câu trả lời
Series là một mảng một chiều có index. Nó đại diện cho một cột dữ liệu duy nhất trong DataFrame. Mỗi phần tử có một nhãn (index) cho phép truy cập nhanh theo tên hoặc vị trí. Series chỉ có thể chứa một kiểu dữ liệu (int, float, string, v.v.), điều này phân biệt nó với một list Python thông thường.
3Hàm Pandas nào đọc file CSV và tải nó vào DataFrame?
Hàm Pandas nào đọc file CSV và tải nó vào DataFrame?
Câu trả lời
Hàm pd.read_csv() đọc file CSV và trả về một DataFrame. Nó chấp nhận nhiều tham số: sep cho dấu phân cách, header cho hàng tiêu đề, encoding cho mã hóa file, dtype để buộc kiểu cột, và na_values để định nghĩa giá trị bị thiếu. Đây là phương pháp phổ biến nhất để nhập dữ liệu vào Pandas.
Thuộc tính df.shape trả về cái gì trên một DataFrame?
Phương thức nào hiển thị 5 hàng đầu tiên của DataFrame?
+17 câu hỏi phỏng vấn
Các chủ đề phỏng vấn Data Analytics khác
Google Sheets - Kiến thức cơ bản
Google Sheets - Công thức nâng cao
SQL - Cơ bản
SQL - Tổng hợp và nhóm
SQL - Joins
BigQuery - Kiến thức cơ bản
Data Cleaning - Làm sạch dữ liệu
KPI và chỉ số kinh doanh
Thống kê mô tả
Zapier và tự động hóa No-Code
Nguyên tắc trực quan hóa dữ liệu
Google Sheets - Dashboard tự động
SQL - Truy vấn con và CTE
SQL - Window Functions
BigQuery - Tính năng nâng cao
Data Modeling
Phân tích Funnel và Chuyển đổi
Phân tích Cohort và Retention
Google Tag Manager và Tracking
API và Webhook
dbt - Kiến thức cơ bản
AB Testing và Thống kê Ứng dụng
Looker Studio (Google Data Studio)
Power BI - Kiến Thức Cơ Bản
SQL - Truy Vấn Phân Tích Nâng Cao
dbt - Tính năng nâng cao
Power BI - DAX và Dashboard Nâng Cao
Python Analytics - Phân tích nâng cao và ML
Nắm vững Data Analytics cho lần phỏng vấn tiếp theo
Truy cập tất cả câu hỏi, flashcards, bài kiểm tra kỹ thuật, bài tập code review và mô phỏng phỏng vấn.
Bắt đầu miễn phí