Data Science & ML

Pandas 기초

DataFrame, Series, 인덱싱, 선택, 필터링, 결측값, 데이터 타입

22 면접 질문·
Junior
1

이름이 지정된 행과 열이 있는 표 형식 데이터를 저장하기 위한 Pandas의 주요 데이터 구조는 무엇입니까?

답변

DataFrame은 2차원 표 형식 데이터를 저장하도록 설계된 Pandas의 핵심 데이터 구조입니다. 각 열은 서로 다른 데이터 타입을 포함할 수 있으며, 행과 열 모두 레이블(인덱스)을 가집니다. 이 구조는 Excel 스프레드시트나 SQL 테이블과 유사하여 구조화된 데이터를 쉽게 조작할 수 있습니다.

2

인덱스가 있는 단일 데이터 열을 나타내는 Pandas 구조는 무엇입니까?

답변

Series는 모든 데이터 타입(정수, 문자열, 부동소수점, Python 객체)을 담을 수 있는 1차원 구조입니다. 각 요소에는 연결된 인덱스가 있어 레이블로 값에 접근할 수 있습니다. DataFrame에서 추출된 열은 자동으로 Series로 변환됩니다.

3

키가 열 이름이 되는 Python 딕셔너리에서 DataFrame을 어떻게 생성합니까?

답변

pd.DataFrame() 함수는 Python 딕셔너리를 직접 받습니다. 딕셔너리 키는 자동으로 열 이름이 되고, 값(리스트 또는 배열)은 각 열의 데이터가 됩니다. 이 방법은 Python에서 구조화된 데이터로부터 DataFrame을 생성하는 가장 일반적인 방법입니다.

4

CSV 파일을 읽어 DataFrame에 로드하는 데 사용해야 하는 메서드는 무엇입니까?

5

데이터의 빠른 미리보기를 위해 DataFrame의 첫 번째 행을 표시하는 메서드는 무엇입니까?

+19 면접 질문

다음 면접을 위해 Data Science & ML을 마스터하세요

모든 질문, flashcards, 기술 테스트, 코드 리뷰 연습, 면접 시뮬레이터에 접근하세요.

무료로 시작하기