Data Analytics

Python Analytics - Розширений аналіз та ML

groupby, merge, pivot_table, apply/map, Plotly, Scikit-Learn (регресія, класифікація, кластеризація), train/test split, метрики, Jupyter, Google Colab

20 питань зі співбесід·
Senior
1

Яка основна різниця між методами apply() та map() на Pandas Series?

Відповідь

Метод map() призначений для відображення кожного значення в Series на нове значення за допомогою словника або функції, і працює лише на Series. На відміну від цього apply() є гнучкішим: він може застосовувати функцію поелементно на Series або порядково/постовпцево на DataFrame. Для простих перетворень значення-в-значення на Series, map() зазвичай швидший і читабельніший.

2

Який метод Pandas слід використовувати для агрегації даних з кількома функціями агрегації на різних стовпцях одночасно?

Відповідь

Метод agg() (або aggregate()) дозволяє застосовувати різні функції агрегації до різних стовпців за одну операцію. Він приймає словник, в якому ключі є іменами стовпців, а значення — функціями для застосування. Цей підхід ефективніший і читабельніший, ніж зчеплення кількох викликів groupby з окремими функціями.

3

Яка різниця між merge() та join() у Pandas?

Відповідь

merge() — це більш гнучка функція, яка об'єднує два DataFrame за певними стовпцями за допомогою параметрів on, left_on/right_on або індексами. join() — це метод DataFrame, який за замовчуванням об'єднується за індексами і є більш стислим для простих об'єднань на основі індексів. Для складних об'єднань на стовпцях не-індексу merge() є кращим, оскільки пропонує більший контроль над стовпцями об'єднання.

4

Як створити зведену таблицю за допомогою pivot_table() із вказанням кількох функцій агрегації?

5

Яка мета transform() у контексті groupby() порівняно з apply()?

+17 питань зі співбесід

Інші теми співбесід Data Analytics

Google Sheets - Основи

Junior
20 запитань

Google Sheets - Розширені формули

Junior
20 запитань

SQL - Основи

Junior
25 запитань

SQL - Агрегації та групування

Junior
20 запитань

SQL - З'єднання

Junior
20 запитань

BigQuery - Основи

Junior
20 запитань

Data Cleaning - Очищення даних

Junior
20 запитань

KPI та бізнес-метрики

Junior
20 запитань

Описова статистика

Junior
20 запитань

Zapier та No-Code автоматизація

Junior
20 запитань

Принципи візуалізації даних

Junior
20 запитань

Python & Pandas - Основи

Junior
20 запитань

Google Sheets - Автоматизовані дашборди

Mid-Level
20 запитань

SQL - Підзапити та CTE

Mid-Level
20 запитань

SQL - Window Functions

Mid-Level
20 запитань

BigQuery - Розширені можливості

Mid-Level
20 запитань

Data Modeling

Mid-Level
20 запитань

Аналіз воронок і конверсії

Mid-Level
20 запитань

Аналіз когорт і утримання

Mid-Level
20 запитань

Google Tag Manager та трекінг

Mid-Level
20 запитань

API та вебхуки

Mid-Level
20 запитань

dbt - Основи

Mid-Level
20 запитань

AB Testing та прикладна статистика

Mid-Level
20 запитань

Looker Studio (Google Data Studio)

Mid-Level
20 запитань

Power BI - Основи

Mid-Level
20 запитань

SQL - Розширені аналітичні запити

Senior
20 запитань

dbt - Розширені можливості

Senior
20 запитань

Power BI - DAX та просунуті дашборди

Senior
20 запитань

Опануй Data Analytics для наступної співбесіди

Отримай доступ до всіх питань, flashcards, технічних тестів, вправ code review та симуляторів співбесід.

Почни безкоштовно