Data Engineering

Fivetran & Airbyte - Ingestão de dados

Conectores, sync modes (full, incremental), CDC, schema evolution, transformações, monitoramento

20 perguntas de entrevista·
Mid-Level
1

Qual é a principal diferença entre Fivetran e Airbyte em termos de modelo de implantação?

Resposta

Fivetran é uma solução SaaS totalmente gerenciada onde a infraestrutura é gerenciada pelo Fivetran, enquanto Airbyte oferece um modelo open-source self-hosted além de uma oferta cloud. Airbyte permite implantar a solução em sua própria infraestrutura (Docker, Kubernetes), oferecendo mais controle sobre dados e custos, enquanto Fivetran simplifica as operações gerenciando toda a manutenção.

2

O que é um connector no contexto de Fivetran ou Airbyte?

Resposta

Um connector é um componente pré-configurado que extrai dados de uma fonte específica (banco de dados, API, SaaS) para um destino (data warehouse, data lake). Cada connector gerencia autenticação, paginação, tratamento de erros e mapeamento de schemas para uma fonte específica, evitando escrever código de integração personalizado.

3

Qual é a diferença entre uma sincronização Full Refresh e Incremental?

Resposta

Full Refresh extrai todos os dados da fonte em cada sincronização e substitui os dados existentes no destino. Incremental transfere apenas dados novos ou alterações desde a última sincronização, usando um cursor (timestamp, ID auto-incremento). Incremental é mais eficiente em termos de tempo, custos e carga na fonte.

4

O que é CDC (Change Data Capture) e por que é usado em ferramentas de ingestão?

5

Qual a principal vantagem que o CDC oferece em comparação com sync incremental baseado em timestamp?

+17 perguntas de entrevista

Domine Data Engineering para sua proxima entrevista

Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.

Comece gratis