
Fivetran & Airbyte - データ取り込み
コネクタ、sync modes (full, incremental)、CDC、schema evolution、変換、モニタリング
20 面接問題·
Mid-Level
1デプロイメントモデルの観点で、FivetranとAirbyteの主な違いは何ですか?
1
デプロイメントモデルの観点で、FivetranとAirbyteの主な違いは何ですか?
回答
Fivetranは、インフラストラクチャがFivetranによって管理される完全マネージドSaaSソリューションであり、一方でAirbyteはcloudオファリングに加えてopen-source self-hostedモデルを提供します。Airbyteは独自のインフラストラクチャ(Docker、Kubernetes)にソリューションをデプロイすることを可能にし、データとコストをより詳細に制御できる一方、Fivetranはすべてのメンテナンスを管理することで運用を簡素化します。
2FivetranまたはAirbyteの文脈でのconnectorとは何ですか?
2
FivetranまたはAirbyteの文脈でのconnectorとは何ですか?
回答
Connectorは、特定のソース(データベース、API、SaaS)から宛先(data warehouse、data lake)へデータを抽出する事前設定されたコンポーネントです。各connectorは、特定のソースの認証、ページネーション、エラー処理、スキーマのマッピングを処理し、カスタム統合コードを記述する必要をなくします。
3Full RefreshとIncrementalの同期の違いは何ですか?
3
Full RefreshとIncrementalの同期の違いは何ですか?
回答
Full Refreshは同期のたびにソースからすべてのデータを抽出し、宛先の既存データを置き換えます。Incrementalは、カーソル(timestamp、自動インクリメントID)を使用して、前回の同期以降の新規データまたは変更のみを転送します。Incrementalは時間、コスト、ソースへの負荷の点でより効率的です。
4
CDC (Change Data Capture)とは何ですか、そしてなぜインジェスションツールで使用されますか?
5
CDCはtimestampベースの増分同期と比較してどのような主な利点を提供しますか?
+17 面接問題
その他のData Engineering面接トピック
Linux & Shell - 基礎
Junior
20問Git & GitHub - 基礎
Junior
20問データエンジニアリングのための高度なPython
Junior
25問Docker - 基礎
Junior
25問Google Cloud Platform - 基礎
Junior
20問CI/CDとコード品質
Mid-Level
20問Docker Compose
Mid-Level
20問FastAPI - データAPI
Mid-Level
20問Data Engineering向けの高度なSQL
Mid-Level
20問Data Lake - アーキテクチャと取り込み
Mid-Level
20問データエンジニアリングのためのBigQuery
Mid-Level
20問PostgreSQL - 管理
Mid-Level
20問Data EngineeringのためのData Modeling
Mid-Level
20問dbt - 基礎
Mid-Level
20問Apache Airflow - 基礎
Mid-Level
20問Kubernetes - 基礎
Mid-Level
20問dbt - 高度な機能
Senior
20問ETL / ELT / ETLT パターン
Senior
20問Apache Airflow - 上級
Senior
20問Airflow + dbt - パイプラインオーケストレーション
Senior
20問PySpark - 大規模処理
Senior
20問Google Pub/Sub - データストリーミング
Senior
20問Apache Beam & Dataflow
Senior
20問Kubernetes - 本番環境とスケーリング
Senior
20問Terraform - Infrastructure as Code
Senior
20問NoSQLデータベース
Senior
20問モダンなData Architecture
Senior
20問モニタリングとオブザーバビリティ
Senior
20問IAMとデータセキュリティ
Senior
20問