Question 1

Pandas Series에서 apply()와 map() 메서드의 주요 차이점은 무엇입니까?

Accepted Answer

map() 메서드는 사전이나 함수를 사용하여 Series의 각 값을 새 값에 매핑하도록 설계되었으며, Series에서만 작동합니다. 반면 apply()는 더 유연합니다: Series에 요소별로 또는 DataFrame에 행/열별로 함수를 적용할 수 있습니다. Series에서 단순한 값-대-값 변환의 경우 map()이 일반적으로 더 빠르고 가독성이 좋습니다.

Question 2

여러 컬럼에 다양한 집계 함수를 동시에 적용하여 데이터를 집계하려면 어떤 Pandas 메서드를 사용해야 합니까?

Accepted Answer

agg() (또는 aggregate()) 메서드를 사용하면 단일 작업에서 다양한 집계 함수를 다양한 컬럼에 적용할 수 있습니다. 키가 컬럼 이름이고 값이 적용할 함수인 사전을 받습니다. 이 접근 방식은 개별 함수로 여러 groupby 호출을 연결하는 것보다 효율적이고 가독성이 좋습니다.

Question 3

Pandas에서 merge()와 join()의 차이점은 무엇입니까?

Accepted Answer

merge()는 on, left_on/right_on 매개변수 또는 인덱스를 사용하여 특정 컬럼에서 두 DataFrame을 조인하는 더 유연한 함수입니다. join()은 기본적으로 인덱스에서 조인하는 DataFrame 메서드이며 단순한 인덱스 기반 조인에 더 간결합니다. 비인덱스 컬럼에서의 복잡한 조인의 경우 조인 컬럼에 대한 더 많은 제어를 제공하는 merge()가 더 좋습니다.

Python Analytics - 고급 분석 및 ML

Pandas Series에서 apply()와 map() 메서드의 주요 차이점은 무엇입니까?

답변

여러 컬럼에 다양한 집계 함수를 동시에 적용하여 데이터를 집계하려면 어떤 Pandas 메서드를 사용해야 합니까?

답변

Pandas에서 merge()와 join()의 차이점은 무엇입니까?

답변

여러 집계 함수를 지정하여 pivot_table()로 피벗 테이블을 만드는 방법은 무엇입니까?

apply()와 비교하여 groupby() 컨텍스트에서 transform()의 목적은 무엇입니까?

기타 Data Analytics 면접 주제

Google Sheets - 기초

Google Sheets - 고급 수식

SQL - 기초

SQL - 집계 및 그룹화

SQL - 조인

BigQuery - 기초

Data Cleaning - 데이터 정제

KPI 및 비즈니스 메트릭

기술 통계

Zapier와 No-Code 자동화

데이터 시각화 원칙

Python & Pandas - 기초

Google Sheets - 자동화된 대시보드

SQL - 서브쿼리와 CTE

SQL - Window Functions

BigQuery - 고급 기능

Data Modeling

퍼널 및 전환 분석

코호트 및 리텐션 분석

Google Tag Manager 및 트래킹

API와 웹훅

dbt - 기초

AB 테스트와 응용 통계학

Looker Studio (Google Data Studio)

Power BI - 기초

SQL - 고급 분석 쿼리

dbt - 고급 기능

Power BI - DAX 및 고급 대시보드

다음 면접을 위해 Data Analytics을 마스터하세요