Data Science & ML

Pandas 고급

GroupBy, merge, concat, pivot tables, time series, apply/transform, MultiIndex, 성능

24 면접 질문·
Mid-Level
1

groupby에서 단일 열에 여러 다른 집계 함수를 적용할 수 있는 메서드는 무엇입니까?

답변

agg()(또는 aggregate()) 메서드는 동일한 열에 여러 집계 함수를 적용할 수 있게 합니다. ['sum', 'mean', 'count']와 같은 함수 목록이나 열별로 다른 함수를 지정하는 딕셔너리를 전달할 수 있습니다. 이러한 유연성은 단일 작업으로 포괄적인 통계 보고서를 생성하는 데 필수적입니다.

2

named aggregation 구문을 사용하여 groupby 집계 중 결과 열의 이름을 명시적으로 지정하는 방법은?

답변

named aggregation 구문은 키워드 인수를 통해 명명된 튜플과 함께 agg()를 사용합니다. 예: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')). 이 접근 방식은 후속 처리를 복잡하게 만들 수 있는 열의 MultiIndex를 피하면서 명시적이고 읽기 쉬운 열 이름을 생성합니다.

3

groupby 컨텍스트에서 transform()과 apply()의 주요 차이점은 무엇입니까?

답변

transform()은 입력과 같은 크기의 결과를 반환하며 원래 인덱스에 정렬되어 각 행에 그룹 통계(예: 그룹 평균)를 추가하는 데 이상적입니다. apply()는 더 유연하며 다른 크기의 결과를 반환할 수 있지만 일반적으로 더 느립니다. 그룹 정규화나 z-score 계산과 같은 작업에는 transform()을 사용하세요.

4

조건을 만족하는 그룹(예: 10개 이상의 요소가 있는 그룹)만 유지하도록 groupby의 그룹을 필터링하는 방법은?

5

how='left'와 how='inner'를 사용한 pd.merge()의 차이점은 무엇입니까?

+21 면접 질문

다음 면접을 위해 Data Science & ML을 마스터하세요

모든 질문, flashcards, 기술 테스트, 코드 리뷰 연습, 면접 시뮬레이터에 접근하세요.

무료로 시작하기