Data Analytics

Python & Pandas - āļžāļ·āđ‰āļ™āļāļēāļ™

DataFrame, Series, āļāļēāļĢāļ—āļģ indexing (loc, iloc), āļāļēāļĢāļāļĢāļ­āļ‡āđāļšāļš boolean, āļ›āļĢāļ°āđ€āļ āļ—āļ‚āđ‰āļ­āļĄāļđāļĨ, read_csv, describe, info, head/tail, shape, columns

20 āļ„āļģāļ–āļēāļĄāļŠāļąāļĄāļ āļēāļĐāļ“āđŒÂ·
Junior
1

āđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāļŦāļĨāļąāļāļ‚āļ­āļ‡ Pandas āļŠāļģāļŦāļĢāļąāļšāļˆāļąāļ”āđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨāđāļšāļšāļ•āļēāļĢāļēāļ‡āļ„āļ·āļ­āļ­āļ°āđ„āļĢ?

āļ„āļģāļ•āļ­āļš

DataFrame āđ€āļ›āđ‡āļ™āđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāļŦāļĨāļąāļāļ‚āļ­āļ‡ Pandas āđ€āļ›āđ‡āļ™āļ•āļēāļĢāļēāļ‡āļŠāļ­āļ‡āļĄāļīāļ•āļīāļ—āļĩāđˆāļĄāļĩāđāļ–āļ§āđāļĨāļ°āļ„āļ­āļĨāļąāļĄāļ™āđŒ āļ„āļĨāđ‰āļēāļĒāļāļąāļš spreadsheet āļŦāļĢāļ·āļ­āļ•āļēāļĢāļēāļ‡ SQL āđāļ•āđˆāļĨāļ°āļ„āļ­āļĨāļąāļĄāļ™āđŒāđ€āļ›āđ‡āļ™ Series āđāļĨāļ°āđāļ•āđˆāļĨāļ°āđāļ–āļ§āļĄāļĩ index DataFrame āļŠāđˆāļ§āļĒāđƒāļŦāđ‰āļŠāļēāļĄāļēāļĢāļ–āļˆāļąāļ”āļāļēāļĢāļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāļĄāļĩāđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āđ„āļ”āđ‰āļ­āļĒāđˆāļēāļ‡āļĄāļĩāļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļœāđˆāļēāļ™ built-in methods āļˆāļģāļ™āļ§āļ™āļĄāļēāļ

2

Series āđƒāļ™ Pandas āļ„āļ·āļ­āļ­āļ°āđ„āļĢ?

āļ„āļģāļ•āļ­āļš

Series āļ„āļ·āļ­ array āļŦāļ™āļķāđˆāļ‡āļĄāļīāļ•āļīāļ—āļĩāđˆāļĄāļĩ index āđāļ—āļ™āļ‚āđ‰āļ­āļĄāļđāļĨāļ„āļ­āļĨāļąāļĄāļ™āđŒāđ€āļ”āļĩāļĒāļ§āđƒāļ™ DataFrame āđāļ•āđˆāļĨāļ° element āļĄāļĩ label (index) āļ—āļĩāđˆāļŠāđˆāļ§āļĒāđƒāļŦāđ‰āđ€āļ‚āđ‰āļēāļ–āļķāļ‡āđ„āļ”āđ‰āļ­āļĒāđˆāļēāļ‡āļĢāļ§āļ”āđ€āļĢāđ‡āļ§āđ‚āļ”āļĒāđƒāļŠāđ‰āļŠāļ·āđˆāļ­āļŦāļĢāļ·āļ­āļ•āļģāđāļŦāļ™āđˆāļ‡ Series āļŠāļēāļĄāļēāļĢāļ–āđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨāđ„āļ”āđ‰āđ€āļžāļĩāļĒāļ‡āļ›āļĢāļ°āđ€āļ āļ—āđ€āļ”āļĩāļĒāļ§ (int, float, string āļŊāļĨāļŊ) āļ‹āļķāđˆāļ‡āļ—āļģāđƒāļŦāđ‰āđāļ•āļāļ•āđˆāļēāļ‡āļˆāļēāļ list āļ‚āļ­āļ‡ Python āļ—āļąāđˆāļ§āđ„āļ›

3

āļŸāļąāļ‡āļāđŒāļŠāļąāļ™ Pandas āđƒāļ”āļ—āļĩāđˆāļ­āđˆāļēāļ™āđ„āļŸāļĨāđŒ CSV āđāļĨāļ°āđ‚āļŦāļĨāļ”āđ€āļ‚āđ‰āļēāļŠāļđāđˆ DataFrame?

āļ„āļģāļ•āļ­āļš

āļŸāļąāļ‡āļāđŒāļŠāļąāļ™ pd.read_csv() āļ­āđˆāļēāļ™āđ„āļŸāļĨāđŒ CSV āđāļĨāļ°āļ„āļ·āļ™āļ„āđˆāļēāđ€āļ›āđ‡āļ™ DataFrame āļĢāļąāļšāļžāļēāļĢāļēāļĄāļīāđ€āļ•āļ­āļĢāđŒāļŦāļĨāļēāļĒāļ•āļąāļ§: sep āļŠāļģāļŦāļĢāļąāļš delimiter, header āļŠāļģāļŦāļĢāļąāļšāđāļ–āļ§āļŦāļąāļ§āļ•āļēāļĢāļēāļ‡, encoding āļŠāļģāļŦāļĢāļąāļšāļāļēāļĢāđ€āļ‚āđ‰āļēāļĢāļŦāļąāļŠāđ„āļŸāļĨāđŒ, dtype āđ€āļžāļ·āđˆāļ­āļšāļąāļ‡āļ„āļąāļš types āļ‚āļ­āļ‡āļ„āļ­āļĨāļąāļĄāļ™āđŒ, āđāļĨāļ° na_values āđ€āļžāļ·āđˆāļ­āļāļģāļŦāļ™āļ”āļ„āđˆāļēāļ—āļĩāđˆāļ‚āļēāļ”āļŦāļēāļĒāđ„āļ› āđ€āļ›āđ‡āļ™āļ§āļīāļ˜āļĩāļ—āļĩāđˆāļžāļšāļĄāļēāļāļ—āļĩāđˆāļŠāļļāļ”āđƒāļ™āļāļēāļĢāļ™āļģāđ€āļ‚āđ‰āļēāļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļ™ Pandas

4

attribute df.shape āļšāļ™ DataFrame āļ„āļ·āļ™āļ„āđˆāļēāļ­āļ°āđ„āļĢ?

5

method āđƒāļ”āļ—āļĩāđˆāđāļŠāļ”āļ‡ 5 āđāļ–āļ§āđāļĢāļāļ‚āļ­āļ‡ DataFrame?

+17 āļ„āļģāļ–āļēāļĄāļŠāļąāļĄāļ āļēāļĐāļ“āđŒ

āļŦāļąāļ§āļ‚āđ‰āļ­āļŠāļąāļĄāļ āļēāļĐāļ“āđŒ Data Analytics āļ­āļ·āđˆāļ™āđ†

Google Sheets - āļžāļ·āđ‰āļ™āļāļēāļ™

Junior
20 āļ„āļģāļ–āļēāļĄ

Google Sheets - āļŠāļđāļ•āļĢāļ‚āļąāđ‰āļ™āļŠāļđāļ‡

Junior
20 āļ„āļģāļ–āļēāļĄ

SQL - āļžāļ·āđ‰āļ™āļāļēāļ™

Junior
25 āļ„āļģāļ–āļēāļĄ

SQL - āļāļēāļĢāļĢāļ§āļĄāđāļĨāļ°āļāļēāļĢāļˆāļąāļ”āļāļĨāļļāđˆāļĄ

Junior
20 āļ„āļģāļ–āļēāļĄ

SQL - Joins

Junior
20 āļ„āļģāļ–āļēāļĄ

BigQuery - āļžāļ·āđ‰āļ™āļāļēāļ™

Junior
20 āļ„āļģāļ–āļēāļĄ

Data Cleaning - āļāļēāļĢāļ—āļģāļ„āļ§āļēāļĄāļŠāļ°āļ­āļēāļ”āļ‚āđ‰āļ­āļĄāļđāļĨ

Junior
20 āļ„āļģāļ–āļēāļĄ

KPI āđāļĨāļ°āđ€āļĄāļ•āļĢāļīāļāļ—āļēāļ‡āļ˜āļļāļĢāļāļīāļˆ

Junior
20 āļ„āļģāļ–āļēāļĄ

āļŠāļ–āļīāļ•āļīāđ€āļŠāļīāļ‡āļžāļĢāļĢāļ“āļ™āļē

Junior
20 āļ„āļģāļ–āļēāļĄ

Zapier āđāļĨāļ°āļĢāļ°āļšāļšāļ­āļąāļ•āđ‚āļ™āļĄāļąāļ•āļī No-Code

Junior
20 āļ„āļģāļ–āļēāļĄ

āļŦāļĨāļąāļāļāļēāļĢ Data Visualization

Junior
20 āļ„āļģāļ–āļēāļĄ

Google Sheets - āđāļ”āļŠāļšāļ­āļĢāđŒāļ”āļ­āļąāļ•āđ‚āļ™āļĄāļąāļ•āļī

Mid-Level
20 āļ„āļģāļ–āļēāļĄ

SQL - Subquery āđāļĨāļ° CTE

Mid-Level
20 āļ„āļģāļ–āļēāļĄ

SQL - Window Functions

Mid-Level
20 āļ„āļģāļ–āļēāļĄ

BigQuery - āļŸāļĩāđ€āļˆāļ­āļĢāđŒāļ‚āļąāđ‰āļ™āļŠāļđāļ‡

Mid-Level
20 āļ„āļģāļ–āļēāļĄ

Data Modeling

Mid-Level
20 āļ„āļģāļ–āļēāļĄ

āļāļēāļĢāļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒ Funnel āđāļĨāļ° Conversion

Mid-Level
20 āļ„āļģāļ–āļēāļĄ

āļāļēāļĢāļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒ Cohort āđāļĨāļ° Retention

Mid-Level
20 āļ„āļģāļ–āļēāļĄ

Google Tag Manager āđāļĨāļ°āļāļēāļĢāļ•āļīāļ”āļ•āļēāļĄ

Mid-Level
20 āļ„āļģāļ–āļēāļĄ

API āđāļĨāļ° Webhook

Mid-Level
20 āļ„āļģāļ–āļēāļĄ

dbt - āļžāļ·āđ‰āļ™āļāļēāļ™

Mid-Level
20 āļ„āļģāļ–āļēāļĄ

AB Testing āđāļĨāļ°āļŠāļ–āļīāļ•āļīāļ›āļĢāļ°āļĒāļļāļāļ•āđŒ

Mid-Level
20 āļ„āļģāļ–āļēāļĄ

Looker Studio (Google Data Studio)

Mid-Level
20 āļ„āļģāļ–āļēāļĄ

Power BI - āļžāļ·āđ‰āļ™āļāļēāļ™

Mid-Level
20 āļ„āļģāļ–āļēāļĄ

SQL - āļāļēāļĢāļ„āļīāļ§āļĢāļĩāđ€āļŠāļīāļ‡āļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒāļ‚āļąāđ‰āļ™āļŠāļđāļ‡

Senior
20 āļ„āļģāļ–āļēāļĄ

dbt - āļŸāļĩāđ€āļˆāļ­āļĢāđŒāļ‚āļąāđ‰āļ™āļŠāļđāļ‡

Senior
20 āļ„āļģāļ–āļēāļĄ

Power BI - DAX āđāļĨāļ°āđāļ”āļŠāļšāļ­āļĢāđŒāļ”āļ‚āļąāđ‰āļ™āļŠāļđāļ‡

Senior
20 āļ„āļģāļ–āļēāļĄ

Python Analytics - āļāļēāļĢāļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒāļ‚āļąāđ‰āļ™āļŠāļđāļ‡āđāļĨāļ° ML

Senior
20 āļ„āļģāļ–āļēāļĄ

āđ€āļŠāļĩāđˆāļĒāļ§āļŠāļēāļ Data Analytics āļŠāļģāļŦāļĢāļąāļšāļāļēāļĢāļŠāļąāļĄāļ āļēāļĐāļ“āđŒāļ„āļĢāļąāđ‰āļ‡āļ–āļąāļ”āđ„āļ›

āđ€āļ‚āđ‰āļēāļ–āļķāļ‡āļ„āļģāļ–āļēāļĄāļ—āļąāđ‰āļ‡āļŦāļĄāļ” flashcards āđāļšāļšāļ—āļ”āļŠāļ­āļšāđ€āļ—āļ„āļ™āļīāļ„ āđāļšāļšāļāļķāļāļŦāļąāļ” code review āđāļĨāļ°āļ•āļąāļ§āļˆāļģāļĨāļ­āļ‡āļŠāļąāļĄāļ āļēāļĐāļ“āđŒ

āđ€āļĢāļīāđˆāļĄāđƒāļŠāđ‰āļŸāļĢāļĩ