
Fivetran & Airbyte - ๋ฐ์ดํฐ ์์ง
์ปค๋ฅํฐ, sync modes (full, incremental), CDC, schema evolution, ๋ณํ, ๋ชจ๋ํฐ๋ง
1๋ฐฐํฌ ๋ชจ๋ธ ๊ด์ ์์ Fivetran๊ณผ Airbyte์ ์ฃผ์ ์ฐจ์ด์ ์ ๋ฌด์์
๋๊น?
๋ฐฐํฌ ๋ชจ๋ธ ๊ด์ ์์ Fivetran๊ณผ Airbyte์ ์ฃผ์ ์ฐจ์ด์ ์ ๋ฌด์์ ๋๊น?
๋ต๋ณ
Fivetran์ ์ธํ๋ผ๊ฐ Fivetran์ ์ํด ๊ด๋ฆฌ๋๋ ์์ ๊ด๋ฆฌํ SaaS ์๋ฃจ์ ์ด๋ฉฐ, Airbyte๋ cloud ์ ๊ณต ์ธ์๋ open-source self-hosted ๋ชจ๋ธ์ ์ ๊ณตํฉ๋๋ค. Airbyte๋ ์์ฒด ์ธํ๋ผ(Docker, Kubernetes)์ ์๋ฃจ์ ์ ๋ฐฐํฌํ ์ ์์ด ๋ฐ์ดํฐ์ ๋น์ฉ์ ๋ํ ๋ ๋ง์ ์ ์ด๋ฅผ ์ ๊ณตํ๋ ๋ฐ๋ฉด, Fivetran์ ๋ชจ๋ ์ ์ง ๊ด๋ฆฌ๋ฅผ ์ฒ๋ฆฌํ์ฌ ์ด์์ ๋จ์ํํฉ๋๋ค.
2Fivetran ๋๋ Airbyte์ ๋งฅ๋ฝ์์ connector๋ ๋ฌด์์
๋๊น?
Fivetran ๋๋ Airbyte์ ๋งฅ๋ฝ์์ connector๋ ๋ฌด์์ ๋๊น?
๋ต๋ณ
Connector๋ ํน์ ์์ค(๋ฐ์ดํฐ๋ฒ ์ด์ค, API, SaaS)์์ ๋์(data warehouse, data lake)์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ถ์ถํ๋ ์ฌ์ ๊ตฌ์ฑ๋ ์ปดํฌ๋ํธ์ ๋๋ค. ๊ฐ connector๋ ์ฃผ์ด์ง ์์ค์ ๋ํ ์ธ์ฆ, ํ์ด์ง๋ค์ด์ , ์ค๋ฅ ์ฒ๋ฆฌ ๋ฐ ์คํค๋ง ๋งคํ์ ์ฒ๋ฆฌํ์ฌ ์ฌ์ฉ์ ์ ์ ํตํฉ ์ฝ๋๋ฅผ ์์ฑํ ํ์๋ฅผ ์์ฑ๋๋ค.
3Full Refresh์ Incremental ๋๊ธฐํ์ ์ฐจ์ด์ ์ ๋ฌด์์
๋๊น?
Full Refresh์ Incremental ๋๊ธฐํ์ ์ฐจ์ด์ ์ ๋ฌด์์ ๋๊น?
๋ต๋ณ
Full Refresh๋ ๋งค ๋๊ธฐํ ์ ์์ค์์ ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ์ถ์ถํ๊ณ ๋์์ ๊ธฐ์กด ๋ฐ์ดํฐ๋ฅผ ๊ต์ฒดํฉ๋๋ค. Incremental์ ์ปค์(timestamp, ์๋ ์ฆ๊ฐ ID)๋ฅผ ์ฌ์ฉํ์ฌ ๋ง์ง๋ง ๋๊ธฐํ ์ดํ์ ์ ๋ฐ์ดํฐ ๋๋ ๋ณ๊ฒฝ ์ฌํญ๋ง ์ ์กํฉ๋๋ค. Incremental์ ์๊ฐ, ๋น์ฉ ๋ฐ ์์ค ๋ถํ ์ธก๋ฉด์์ ๋ ํจ์จ์ ์ ๋๋ค.
CDC (Change Data Capture)๋ ๋ฌด์์ด๋ฉฐ ์์ง ๋๊ตฌ์์ ์ ์ฌ์ฉ๋ฉ๋๊น?
CDC๊ฐ timestamp ๊ธฐ๋ฐ ์ฆ๋ถ sync์ ๋นํด ์ ๊ณตํ๋ ์ฃผ์ ์ด์ ์ ๋ฌด์์ ๋๊น?
+17 ๋ฉด์ ์ง๋ฌธ
๊ธฐํ Data Engineering ๋ฉด์ ์ฃผ์
Linux & Shell - ๊ธฐ์ด
Git & GitHub - ๊ธฐ์ด
๋ฐ์ดํฐ ์์ง๋์ด๋ง์ ์ํ ๊ณ ๊ธ Python
Docker - ๊ธฐ์ด
Google Cloud Platform - ๊ธฐ์ด
CI/CD ๋ฐ ์ฝ๋ ํ์ง
Docker Compose
FastAPI - ๋ฐ์ดํฐ API
Data Engineering์ ์ํ ๊ณ ๊ธ SQL
Data Lake - ์ํคํ ์ฒ ๋ฐ ์์ง
๋ฐ์ดํฐ ์์ง๋์ด๋ง์ ์ํ BigQuery
PostgreSQL - ๊ด๋ฆฌ
Data Engineering์ ์ํ Data Modeling
dbt - ๊ธฐ์ด
Apache Airflow - ๊ธฐ์ด
Kubernetes - ๊ธฐ์ด
dbt - ๊ณ ๊ธ ๊ธฐ๋ฅ
ETL / ELT / ETLT ํจํด
Apache Airflow - ๊ณ ๊ธ
Airflow + dbt - ํ์ดํ๋ผ์ธ ์ค์ผ์คํธ๋ ์ด์
PySpark - ๋๊ท๋ชจ ์ฒ๋ฆฌ
Google Pub/Sub - ๋ฐ์ดํฐ ์คํธ๋ฆฌ๋ฐ
Apache Beam & Dataflow
Kubernetes - ํ๋ก๋์ ๋ฐ ์ค์ผ์ผ๋ง
Terraform - Infrastructure as Code
NoSQL ๋ฐ์ดํฐ๋ฒ ์ด์ค
๋ชจ๋ Data Architecture
๋ชจ๋ํฐ๋ง ๋ฐ ๊ด์ฐฐ ๊ฐ๋ฅ์ฑ
IAM ๋ฐ ๋ฐ์ดํฐ ๋ณด์
๋ค์ ๋ฉด์ ์ ์ํด Data Engineering์ ๋ง์คํฐํ์ธ์
๋ชจ๋ ์ง๋ฌธ, flashcards, ๊ธฐ์ ํ ์คํธ, ์ฝ๋ ๋ฆฌ๋ทฐ ์ฐ์ต, ๋ฉด์ ์๋ฎฌ๋ ์ดํฐ์ ์ ๊ทผํ์ธ์.
๋ฌด๋ฃ๋ก ์์ํ๊ธฐ