Data Analytics

Data Analytics

DATA

Chương trình Data Analytics toàn diện bao quát toàn bộ chuỗi giá trị dữ liệu. Từ thao tác dữ liệu với Google Sheets và SQL đến tạo dashboard tương tác với Power BI và Looker Studio, qua tự động hóa với công cụ ELT (dbt, Zapier) và phân tích dự đoán với Python (Pandas, Scikit-Learn). Học cách xác định nguồn dữ liệu, xây dựng phễu, phân tích giữ chân khách hàng, và đề xuất hành động cụ thể từ phân tích.

Bạn sẽ học được gì

Thao tác dữ liệu với Google Sheets và công thức nâng cao

SQL nâng cao với BigQuery: truy vấn phân tích, CTE, window function

Mô hình hóa dữ liệu cho đội marketing, sales và sản phẩm

Công cụ ELT: dbt cho chuyển đổi, Zapier cho tự động hóa

Theo dõi web với Google Tag Manager và kế hoạch tracking

API và webhook cho trích xuất dữ liệu

Trực quan hóa dữ liệu với Power BI và Looker Studio (Google Data Studio)

Phân tích thống kê và AB testing

Python cho phân tích: Pandas, Plotly, Jupyter, Google Colab

Machine Learning ứng dụng: dự đoán rời bỏ, phân khúc khách hàng với Scikit-Learn

Phương pháp phân tích: KPI, phễu bán hàng, giữ chân, cohort

Dự án end-to-end: từ xác định vấn đề đến dashboard tự động

Chủ đề chính cần nắm vững

Những khái niệm quan trọng nhất để hiểu công nghệ này và thành công trong phỏng vấn

1

Google Sheets: công thức nâng cao (VLOOKUP, INDEX/MATCH, ARRAYFORMULA), bảng tổng hợp, tự động hóa

2

SQL: SELECT, JOIN, GROUP BY, HAVING, window function (ROW_NUMBER, RANK, LAG/LEAD), CTE, truy vấn con

3

BigQuery: phân vùng, gom cụm, truy vấn lồng nhau, tối ưu chi phí, UDF

4

Mô hình hóa dữ liệu: lược đồ hình sao, bảng fact và dimension, chuẩn hóa, phi chuẩn hóa

5

KPI và Chỉ số: CAC, LTV, MRR, ARR, tỷ lệ rời bỏ, NPS, tỷ lệ chuyển đổi, ARPU

6

Phễu và Cohort: phân tích chuyển đổi, giữ chân theo cohort, phân tích RFM

7

ELT và Data Pipeline: Extract-Load-Transform, dbt (model, test, source), điều phối

8

Zapier và tự động hóa: trigger, action, quy trình nhiều bước, webhook

9

Google Tag Manager: tag, trigger, biến, dataLayer, kế hoạch tracking

10

Power BI: DAX, chỉ số tính toán, quan hệ, trực quan hóa, bộ lọc, drill-down

11

Looker Studio: nguồn dữ liệu, trường tính toán, bộ lọc, tham số, kết hợp

12

Trực quan hóa: chọn biểu đồ phù hợp, kể chuyện bằng dữ liệu, nguyên tắc thiết kế (Tufte)

13

AB Testing: giả thuyết, kích thước mẫu, ý nghĩa thống kê, giá trị p, kiểm định t Student

14

Python và Pandas: DataFrame, Series, groupby, merge, pivot_table, làm sạch

15

Plotly: biểu đồ tương tác, subplot, animation, dashboard

16

Scikit-Learn: hồi quy, phân loại, gom cụm (K-Means), chia train/test, chỉ số

17

Phương pháp: đặt vấn đề, xác định nguồn, làm sạch, phân tích, đề xuất