
Python Analytics - Розширений аналіз та ML
groupby, merge, pivot_table, apply/map, Plotly, Scikit-Learn (регресія, класифікація, кластеризація), train/test split, метрики, Jupyter, Google Colab
1Яка основна різниця між методами apply() та map() на Pandas Series?
Яка основна різниця між методами apply() та map() на Pandas Series?
Відповідь
Метод map() призначений для відображення кожного значення в Series на нове значення за допомогою словника або функції, і працює лише на Series. На відміну від цього apply() є гнучкішим: він може застосовувати функцію поелементно на Series або порядково/постовпцево на DataFrame. Для простих перетворень значення-в-значення на Series, map() зазвичай швидший і читабельніший.
2Який метод Pandas слід використовувати для агрегації даних з кількома функціями агрегації на різних стовпцях одночасно?
Який метод Pandas слід використовувати для агрегації даних з кількома функціями агрегації на різних стовпцях одночасно?
Відповідь
Метод agg() (або aggregate()) дозволяє застосовувати різні функції агрегації до різних стовпців за одну операцію. Він приймає словник, в якому ключі є іменами стовпців, а значення — функціями для застосування. Цей підхід ефективніший і читабельніший, ніж зчеплення кількох викликів groupby з окремими функціями.
3Яка різниця між merge() та join() у Pandas?
Яка різниця між merge() та join() у Pandas?
Відповідь
merge() — це більш гнучка функція, яка об'єднує два DataFrame за певними стовпцями за допомогою параметрів on, left_on/right_on або індексами. join() — це метод DataFrame, який за замовчуванням об'єднується за індексами і є більш стислим для простих об'єднань на основі індексів. Для складних об'єднань на стовпцях не-індексу merge() є кращим, оскільки пропонує більший контроль над стовпцями об'єднання.
Як створити зведену таблицю за допомогою pivot_table() із вказанням кількох функцій агрегації?
Яка мета transform() у контексті groupby() порівняно з apply()?
+17 питань зі співбесід
Інші теми співбесід Data Analytics
Google Sheets - Основи
Google Sheets - Розширені формули
SQL - Основи
SQL - Агрегації та групування
SQL - З'єднання
BigQuery - Основи
Data Cleaning - Очищення даних
KPI та бізнес-метрики
Описова статистика
Zapier та No-Code автоматизація
Принципи візуалізації даних
Python & Pandas - Основи
Google Sheets - Автоматизовані дашборди
SQL - Підзапити та CTE
SQL - Window Functions
BigQuery - Розширені можливості
Data Modeling
Аналіз воронок і конверсії
Аналіз когорт і утримання
Google Tag Manager та трекінг
API та вебхуки
dbt - Основи
AB Testing та прикладна статистика
Looker Studio (Google Data Studio)
Power BI - Основи
SQL - Розширені аналітичні запити
dbt - Розширені можливості
Power BI - DAX та просунуті дашборди
Опануй Data Analytics для наступної співбесіди
Отримай доступ до всіх питань, flashcards, технічних тестів, вправ code review та симуляторів співбесід.
Почни безкоштовно