Data Analytics

BigQuery - 고급 기능

파티셔닝, 클러스터링, 구체화된 뷰, UDF, 중첩 쿼리, STRUCT, ARRAY

20 면접 질문·
Mid-Level
1

BigQuery에서 파티셔닝의 주요 역할은 무엇입니까?

답변

파티셔닝은 컬럼(주로 날짜)을 기준으로 테이블을 세그먼트로 나누어 쿼리 중 스캔되는 데이터 양을 줄입니다. 쿼리가 파티션 컬럼으로 필터링하면 BigQuery는 전체 테이블을 스캔하는 대신 관련 파티션만 읽습니다. 이는 성능을 향상시키고 스캔된 데이터 볼륨에 따라 청구되는 쿼리 비용을 줄여줍니다.

2

BigQuery에서 사용 가능한 파티셔닝 유형은 무엇입니까?

답변

BigQuery는 세 가지 유형의 파티셔닝을 제공합니다: DATE, TIMESTAMP 또는 DATETIME 컬럼별(가장 일반적), 정수 범위별(INTEGER RANGE), 그리고 수집 시간별(_PARTITIONTIME). 날짜 기반 파티셔닝은 대부분의 분석이 시간 기간으로 필터링하기 때문에 가장 널리 사용됩니다. 정수 범위 파티셔닝은 숫자 식별자에 유용합니다.

3

BigQuery에서 STRUCT란 무엇입니까?

답변

STRUCT(또는 RECORD)는 잠재적으로 다른 유형의 명명된 여러 필드를 단일 컬럼으로 그룹화하는 데이터 유형입니다. 예를 들어, STRUCT는 이름(STRING), 나이(INT64), 이메일(STRING)을 포함할 수 있습니다. STRUCT를 사용하면 테이블 내에서 직접 계층적 데이터를 모델링할 수 있으며, 비용이 많이 드는 조인을 피할 수 있습니다. 필드는 점 표기법(struct_col.field)을 사용하여 액세스합니다.

4

BigQuery에서 ARRAY란 무엇입니까?

5

BigQuery의 UNNEST 함수의 목적은 무엇입니까?

+17 면접 질문

다음 면접을 위해 Data Analytics을 마스터하세요

모든 질문, flashcards, 기술 테스트, 코드 리뷰 연습, 면접 시뮬레이터에 접근하세요.

무료로 시작하기