
モニタリングとオブザーバビリティ
構造化ロギング、メトリクス、アラート、SLA/SLO/SLI、データ品質チェック、Great Expectations、Soda
20 面接問題·
Senior
1データパイプラインの文脈における構造化ロギングとは何ですか?
1
データパイプラインの文脈における構造化ロギングとは何ですか?
回答
構造化ロギングとは、フリーテキストではなく、パース可能な形式(JSON、key-value)でログを出力することです。これにより、Cloud Logging、Elasticsearch、Datadogなどのツールでログを簡単にフィルタリング、検索、集約できます。データパイプラインでは、DAG、task_id、run_id、その他のビジネスコンテキストでフィルタリングできるため、デバッグが大幅に容易になります。
2SLI(Service Level Indicator)とSLO(Service Level Objective)の違いは何ですか?
2
SLI(Service Level Indicator)とSLO(Service Level Objective)の違いは何ですか?
回答
SLIは、サービス品質の側面(ジョブ成功率、パイプラインのレイテンシなど)を定量化する測定可能なメトリクスです。SLOはそのメトリクスに対して定義された目標値(例:ジョブの99.5%が成功する必要がある)です。SLAは内部SLOに基づく顧客への契約上のコミットメントです。この階層により、信頼性を客観的にモニタリングし、SLA違反前にアラートをトリガーできます。
3Great ExpectationsにおけるExpectationとは何ですか?
3
Great ExpectationsにおけるExpectationとは何ですか?
回答
Expectationは、expect_column_values_to_not_be_nullやexpect_column_values_to_be_betweenのような、データに関する宣言的アサーションです。Great Expectationsは自動的にドキュメントと実行可能な検証結果を生成します。これらのExpectationはSuiteにグループ化され、データセットの完全な品質契約を定義します。
4
データパイプラインにおけるSodaの主な役割は何ですか?
5
データインシデント管理の文脈における、runbookとは何ですか?
+17 面接問題
その他のData Engineering面接トピック
Linux & Shell - 基礎
Junior
20問Git & GitHub - 基礎
Junior
20問データエンジニアリングのための高度なPython
Junior
25問Docker - 基礎
Junior
25問Google Cloud Platform - 基礎
Junior
20問CI/CDとコード品質
Mid-Level
20問Docker Compose
Mid-Level
20問FastAPI - データAPI
Mid-Level
20問Data Engineering向けの高度なSQL
Mid-Level
20問Data Lake - アーキテクチャと取り込み
Mid-Level
20問データエンジニアリングのためのBigQuery
Mid-Level
20問PostgreSQL - 管理
Mid-Level
20問Data EngineeringのためのData Modeling
Mid-Level
20問Fivetran & Airbyte - データ取り込み
Mid-Level
20問dbt - 基礎
Mid-Level
20問Apache Airflow - 基礎
Mid-Level
20問Kubernetes - 基礎
Mid-Level
20問dbt - 高度な機能
Senior
20問ETL / ELT / ETLT パターン
Senior
20問Apache Airflow - 上級
Senior
20問Airflow + dbt - パイプラインオーケストレーション
Senior
20問PySpark - 大規模処理
Senior
20問Google Pub/Sub - データストリーミング
Senior
20問Apache Beam & Dataflow
Senior
20問Kubernetes - 本番環境とスケーリング
Senior
20問Terraform - Infrastructure as Code
Senior
20問NoSQLデータベース
Senior
20問モダンなData Architecture
Senior
20問IAMとデータセキュリティ
Senior
20問