
Fivetran & Airbyte - Veri Alımı
Konektörler, sync modes (full, incremental), CDC, schema evolution, dönüşümler, izleme
1Dağıtım modeli açısından Fivetran ile Airbyte arasındaki temel fark nedir?
Dağıtım modeli açısından Fivetran ile Airbyte arasındaki temel fark nedir?
Cevap
Fivetran, altyapının Fivetran tarafından yönetildiği tam yönetilen bir SaaS çözümüdür; Airbyte ise cloud teklifine ek olarak open-source self-hosted bir model sunar. Airbyte, çözümü kendi altyapınızda (Docker, Kubernetes) dağıtmanıza olanak tanıyarak veri ve maliyetler üzerinde daha fazla kontrol sağlarken, Fivetran tüm bakımı yöneterek operasyonları basitleştirir.
2Fivetran veya Airbyte bağlamında connector nedir?
Fivetran veya Airbyte bağlamında connector nedir?
Cevap
Connector, belirli bir kaynaktan (veritabanı, API, SaaS) bir hedefe (data warehouse, data lake) veri çıkaran önceden yapılandırılmış bir bileşendir. Her connector, belirli bir kaynak için kimlik doğrulama, sayfalama, hata yönetimi ve schema eşleştirmesini ele alarak özel entegrasyon kodu yazma ihtiyacını ortadan kaldırır.
3Full Refresh ile Incremental senkronizasyon arasındaki fark nedir?
Full Refresh ile Incremental senkronizasyon arasındaki fark nedir?
Cevap
Full Refresh her senkronizasyonda kaynaktaki tüm verileri çıkarır ve hedefteki mevcut verileri değiştirir. Incremental, bir cursor (timestamp, auto-increment ID) kullanarak yalnızca son senkronizasyondan bu yana yeni veya değişen verileri aktarır. Incremental zaman, maliyet ve kaynak yükü açısından daha verimlidir.
CDC (Change Data Capture) nedir ve ingestion araçlarında neden kullanılır?
CDC, timestamp tabanlı artımlı sync'e kıyasla hangi temel avantajı sağlar?
+17 mülakat soruları
Diğer Data Engineering mülakat konuları
Linux & Shell - Temeller
Git & GitHub - Temeller
Data Engineering için ileri düzey Python
Docker - Temeller
Google Cloud Platform - Temeller
CI/CD ve Kod Kalitesi
Docker Compose
FastAPI - Veri API'leri
Data Engineering için İleri Seviye SQL
Data Lake - Mimari ve Veri Alımı
Data Engineering için BigQuery
PostgreSQL - Yönetim
Data Engineering için Data Modeling
dbt - Temeller
Apache Airflow - Temeller
Kubernetes - Temeller
dbt - Gelişmiş özellikler
ETL / ELT / ETLT Desenleri
Apache Airflow - İleri Seviye
Airflow + dbt - Pipeline Orkestrasyonu
PySpark - Büyük Ölçekli İşleme
Google Pub/Sub - Veri Streaming
Apache Beam & Dataflow
Kubernetes - Üretim ve Ölçeklendirme
Terraform - Infrastructure as Code
NoSQL Veritabanları
Modern Data Architecture
İzleme ve Gözlemlenebilirlik
IAM ve Veri Güvenliği
Bir sonraki mülakatın için Data Engineering'de uzmanlaş
Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.
Ücretsiz başla