Data Engineering

dbt - 기초

dbt 프로젝트, models, sources, refs, tests, 문서화, materializations (table, view, incremental), seeds

20 면접 질문·
Mid-Level
1

dbt(data build tool)란 무엇입니까?

답변

dbt는 SQL로 변환을 작성하여 data warehouse에서 실행할 수 있는 데이터 변환 도구입니다. 소프트웨어 엔지니어링 원칙(버전 관리, 테스트, 문서화)을 데이터 변환 작업에 적용합니다. dbt는 추출이나 로드(ELT의 E와 L)를 처리하지 않고 변환만 수행합니다.

2

dbt 프로젝트의 기본 구조는 무엇입니까?

답변

dbt 프로젝트는 프로젝트 설정을 정의하는 dbt_project.yml 파일을 루트에 포함합니다. 주요 폴더는 models (SQL 파일 포함), 커스텀 tests를 위한 tests, Jinja 매크로를 위한 macros, CSV 파일을 위한 seeds, 그리고 이력 데이터 캡처를 위한 snapshots입니다. profiles.yml 파일(보통 프로젝트 외부)은 warehouse 연결을 정의합니다.

3

dbt에서 profiles.yml 파일의 역할은 무엇입니까?

답변

profiles.yml 파일은 data warehouse(BigQuery, Snowflake, Redshift, PostgreSQL 등)에 대한 연결 정보를 포함합니다. 민감한 자격 증명을 버전 관리하지 않기 위해 일반적으로 프로젝트가 아닌 ~/.dbt/ 폴더에 저장됩니다. 각 프로파일은 여러 타겟(dev, prod)을 가질 수 있어 환경 간 전환이 쉽습니다.

4

dbt에서 model이란 무엇입니까?

5

dbt에서 ref() 함수의 역할은 무엇입니까?

+17 면접 질문

다음 면접을 위해 Data Engineering을 마스터하세요

모든 질문, flashcards, 기술 테스트, 코드 리뷰 연습, 면접 시뮬레이터에 접근하세요.

무료로 시작하기