Data Engineering

モニタリングとオブザーバビリティ

構造化ロギング、メトリクス、アラート、SLA/SLO/SLI、データ品質チェック、Great Expectations、Soda

20 面接問題·
Senior
1

データパイプラインの文脈における構造化ロギングとは何ですか?

回答

構造化ロギングとは、フリーテキストではなく、パース可能な形式(JSON、key-value)でログを出力することです。これにより、Cloud Logging、Elasticsearch、Datadogなどのツールでログを簡単にフィルタリング、検索、集約できます。データパイプラインでは、DAG、task_id、run_id、その他のビジネスコンテキストでフィルタリングできるため、デバッグが大幅に容易になります。

2

SLI(Service Level Indicator)とSLO(Service Level Objective)の違いは何ですか?

回答

SLIは、サービス品質の側面(ジョブ成功率、パイプラインのレイテンシなど)を定量化する測定可能なメトリクスです。SLOはそのメトリクスに対して定義された目標値(例:ジョブの99.5%が成功する必要がある)です。SLAは内部SLOに基づく顧客への契約上のコミットメントです。この階層により、信頼性を客観的にモニタリングし、SLA違反前にアラートをトリガーできます。

3

Great ExpectationsにおけるExpectationとは何ですか?

回答

Expectationは、expect_column_values_to_not_be_nullやexpect_column_values_to_be_betweenのような、データに関する宣言的アサーションです。Great Expectationsは自動的にドキュメントと実行可能な検証結果を生成します。これらのExpectationはSuiteにグループ化され、データセットの完全な品質契約を定義します。

4

データパイプラインにおけるSodaの主な役割は何ですか?

5

データインシデント管理の文脈における、runbookとは何ですか?

+17 面接問題

次の面接に向けてData Engineeringをマスター

すべての問題、flashcards、技術テスト、コードレビュー演習、面接シミュレーターにアクセス。

無料で始める