Question 1

groupby에서 단일 열에 여러 다른 집계 함수를 적용할 수 있는 메서드는 무엇입니까?

Accepted Answer

agg()(또는 aggregate()) 메서드는 동일한 열에 여러 집계 함수를 적용할 수 있게 합니다. ['sum', 'mean', 'count']와 같은 함수 목록이나 열별로 다른 함수를 지정하는 딕셔너리를 전달할 수 있습니다. 이러한 유연성은 단일 작업으로 포괄적인 통계 보고서를 생성하는 데 필수적입니다.

Question 2

named aggregation 구문을 사용하여 groupby 집계 중 결과 열의 이름을 명시적으로 지정하는 방법은?

Accepted Answer

named aggregation 구문은 키워드 인수를 통해 명명된 튜플과 함께 agg()를 사용합니다. 예: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')). 이 접근 방식은 후속 처리를 복잡하게 만들 수 있는 열의 MultiIndex를 피하면서 명시적이고 읽기 쉬운 열 이름을 생성합니다.

Question 3

groupby 컨텍스트에서 transform()과 apply()의 주요 차이점은 무엇입니까?

Accepted Answer

transform()은 입력과 같은 크기의 결과를 반환하며 원래 인덱스에 정렬되어 각 행에 그룹 통계(예: 그룹 평균)를 추가하는 데 이상적입니다. apply()는 더 유연하며 다른 크기의 결과를 반환할 수 있지만 일반적으로 더 느립니다. 그룹 정규화나 z-score 계산과 같은 작업에는 transform()을 사용하세요.

Pandas 고급

groupby에서 단일 열에 여러 다른 집계 함수를 적용할 수 있는 메서드는 무엇입니까?

답변

named aggregation 구문을 사용하여 groupby 집계 중 결과 열의 이름을 명시적으로 지정하는 방법은?

답변

groupby 컨텍스트에서 transform()과 apply()의 주요 차이점은 무엇입니까?

답변

조건을 만족하는 그룹(예: 10개 이상의 요소가 있는 그룹)만 유지하도록 groupby의 그룹을 필터링하는 방법은?

how='left'와 how='inner'를 사용한 pd.merge()의 차이점은 무엇입니까?

기타 Data Science & ML 면접 주제

Python 기초

Python 객체 지향 프로그래밍

Python 데이터 구조

Git 기초

SQL 기초

NumPy 기초

Pandas 기초

Jupyter & Google Colab

SQL Joins 및 고급 쿼리

Matplotlib & Seaborn을 활용한 시각화

Plotly로 만드는 인터랙티브 시각화

기술 통계

추론 통계학

Web Scraping

BigQuery & Cloud Data

Feature Engineering

지도 머신러닝: 회귀

지도 머신러닝: 분류

결정 트리 및 앙상블

비지도 ML

ML 파이프라인 및 검증

시계열 및 예측

Deep Learning 기초

TensorFlow & Keras

CNN 및 이미지 분류

RNN 및 시퀀스

Transformers 및 Attention

NLP 및 Hugging Face

GenAI 및 LangChain

MLOps 및 배포

다음 면접을 위해 Data Science & ML을 마스터하세요