Data Analytics

Python Analytics - 고급 분석 및 ML

groupby, merge, pivot_table, apply/map, Plotly, Scikit-Learn (회귀, 분류, 클러스터링), train/test split, 메트릭, Jupyter, Google Colab

20 면접 질문·
Senior
1

Pandas Series에서 apply()와 map() 메서드의 주요 차이점은 무엇입니까?

답변

map() 메서드는 사전이나 함수를 사용하여 Series의 각 값을 새 값에 매핑하도록 설계되었으며, Series에서만 작동합니다. 반면 apply()는 더 유연합니다: Series에 요소별로 또는 DataFrame에 행/열별로 함수를 적용할 수 있습니다. Series에서 단순한 값-대-값 변환의 경우 map()이 일반적으로 더 빠르고 가독성이 좋습니다.

2

여러 컬럼에 다양한 집계 함수를 동시에 적용하여 데이터를 집계하려면 어떤 Pandas 메서드를 사용해야 합니까?

답변

agg() (또는 aggregate()) 메서드를 사용하면 단일 작업에서 다양한 집계 함수를 다양한 컬럼에 적용할 수 있습니다. 키가 컬럼 이름이고 값이 적용할 함수인 사전을 받습니다. 이 접근 방식은 개별 함수로 여러 groupby 호출을 연결하는 것보다 효율적이고 가독성이 좋습니다.

3

Pandas에서 merge()와 join()의 차이점은 무엇입니까?

답변

merge()는 on, left_on/right_on 매개변수 또는 인덱스를 사용하여 특정 컬럼에서 두 DataFrame을 조인하는 더 유연한 함수입니다. join()은 기본적으로 인덱스에서 조인하는 DataFrame 메서드이며 단순한 인덱스 기반 조인에 더 간결합니다. 비인덱스 컬럼에서의 복잡한 조인의 경우 조인 컬럼에 대한 더 많은 제어를 제공하는 merge()가 더 좋습니다.

4

여러 집계 함수를 지정하여 pivot_table()로 피벗 테이블을 만드는 방법은 무엇입니까?

5

apply()와 비교하여 groupby() 컨텍스트에서 transform()의 목적은 무엇입니까?

+17 면접 질문

다음 면접을 위해 Data Analytics을 마스터하세요

모든 질문, flashcards, 기술 테스트, 코드 리뷰 연습, 면접 시뮬레이터에 접근하세요.

무료로 시작하기