Data Engineering

Fivetran & Airbyte - Ingesti Data

Connector, sync modes (full, incremental), CDC, schema evolution, transformasi, monitoring

20 pertanyaan wawancaraยท
Mid-Level
1

Apa perbedaan utama antara Fivetran dan Airbyte dalam hal model deployment?

Jawaban

Fivetran adalah solusi SaaS fully managed di mana infrastruktur dikelola oleh Fivetran, sementara Airbyte menawarkan model open-source self-hosted selain penawaran cloud. Airbyte memungkinkan deployment solusi pada infrastruktur Anda sendiri (Docker, Kubernetes), memberikan lebih banyak kontrol atas data dan biaya, sedangkan Fivetran menyederhanakan operasi dengan mengelola seluruh maintenance.

2

Apa itu connector dalam konteks Fivetran atau Airbyte?

Jawaban

Connector adalah komponen pre-configured yang mengekstrak data dari source tertentu (database, API, SaaS) ke destination (data warehouse, data lake). Setiap connector menangani autentikasi, pagination, error handling, dan schema mapping untuk source tertentu, menghindari kebutuhan menulis kode integrasi kustom.

3

Apa perbedaan antara sinkronisasi Full Refresh dan Incremental?

Jawaban

Full Refresh mengekstrak semua data dari source pada setiap sinkronisasi dan menggantikan data yang ada di destination. Incremental hanya mentransfer data baru atau perubahan sejak sinkronisasi terakhir, menggunakan cursor (timestamp, ID auto-increment). Incremental lebih efisien dari segi waktu, biaya, dan beban pada source.

4

Apa itu CDC (Change Data Capture) dan mengapa digunakan dalam tools ingesti?

5

Apa keunggulan utama yang diberikan CDC dibandingkan sinkronisasi incremental berbasis timestamp?

+17 pertanyaan wawancara

Kuasai Data Engineering untuk wawancara berikutnya

Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.

Mulai gratis