
데이터 엔지니어링을 위한 BigQuery
서버리스 아키텍처, 파티셔닝, 클러스터링, 비용, UDF, federated queries, scheduled queries, materialized views
20 면접 질문·
Mid-Level
1BigQuery는 어떤 스토리지 아키텍처를 사용합니까?
1
BigQuery는 어떤 스토리지 아키텍처를 사용합니까?
답변
BigQuery는 Capacitor라는 컬럼형 스토리지를 가진 서버리스 아키텍처를 사용합니다. 이 아키텍처는 스토리지와 컴퓨팅을 분리하여 독립적인 확장과 별도의 청구를 가능하게 합니다. 컬럼형 스토리지는 필요한 컬럼만 읽을 수 있어 I/O를 크게 줄이므로 분석 쿼리에 최적화되어 있습니다.
2BigQuery에서 테이블 파티셔닝의 주요 이점은 무엇입니까?
2
BigQuery에서 테이블 파티셔닝의 주요 이점은 무엇입니까?
답변
파티셔닝은 큰 테이블을 컬럼(보통 날짜)을 기반으로 작은 세그먼트로 나눕니다. 쿼리 중에 BigQuery는 관련 없는 파티션을 건너뛰어(partition pruning) 스캔되는 데이터 양을 줄일 수 있습니다. BigQuery는 처리된 데이터 볼륨에 따라 요금을 부과하므로 이는 성능을 향상시키고 비용을 줄입니다.
3BigQuery에서 사용 가능한 파티셔닝 유형은 무엇입니까?
3
BigQuery에서 사용 가능한 파티셔닝 유형은 무엇입니까?
답변
BigQuery는 세 가지 파티셔닝 유형을 지원합니다: DATE 또는 TIMESTAMP 컬럼별(가장 일반적), 정수 범위별(INTEGER RANGE), 수집 시간별(_PARTITIONTIME). 날짜 필터에서 효율적인 partition pruning을 가능하게 하므로 시계열 데이터에는 날짜 파티셔닝이 권장됩니다.
4
BigQuery에서 파티셔닝과 클러스터링의 차이점은 무엇입니까?
5
BigQuery에서 쿼리 비용을 최적화하는 방법은?
+17 면접 질문
기타 Data Engineering 면접 주제
Linux & Shell - 기초
Junior
20개 질문Git & GitHub - 기초
Junior
20개 질문데이터 엔지니어링을 위한 고급 Python
Junior
25개 질문Docker - 기초
Junior
25개 질문Google Cloud Platform - 기초
Junior
20개 질문CI/CD 및 코드 품질
Mid-Level
20개 질문Docker Compose
Mid-Level
20개 질문FastAPI - 데이터 API
Mid-Level
20개 질문Data Engineering을 위한 고급 SQL
Mid-Level
20개 질문Data Lake - 아키텍처 및 수집
Mid-Level
20개 질문PostgreSQL - 관리
Mid-Level
20개 질문Data Engineering을 위한 Data Modeling
Mid-Level
20개 질문Fivetran & Airbyte - 데이터 수집
Mid-Level
20개 질문dbt - 기초
Mid-Level
20개 질문Apache Airflow - 기초
Mid-Level
20개 질문Kubernetes - 기초
Mid-Level
20개 질문dbt - 고급 기능
Senior
20개 질문ETL / ELT / ETLT 패턴
Senior
20개 질문Apache Airflow - 고급
Senior
20개 질문Airflow + dbt - 파이프라인 오케스트레이션
Senior
20개 질문PySpark - 대규모 처리
Senior
20개 질문Google Pub/Sub - 데이터 스트리밍
Senior
20개 질문Apache Beam & Dataflow
Senior
20개 질문Kubernetes - 프로덕션 및 스케일링
Senior
20개 질문Terraform - Infrastructure as Code
Senior
20개 질문NoSQL 데이터베이스
Senior
20개 질문모던 Data Architecture
Senior
20개 질문모니터링 및 관찰 가능성
Senior
20개 질문IAM 및 데이터 보안
Senior
20개 질문