
データエンジニアリングのためのBigQuery
サーバーレスアーキテクチャ、パーティショニング、クラスタリング、コスト、UDF、federated queries、scheduled queries、materialized views
20 面接問題·
Mid-Level
1BigQueryはどのストレージアーキテクチャを使用しますか?
1
BigQueryはどのストレージアーキテクチャを使用しますか?
回答
BigQueryは、Capacitorと呼ばれるカラム型ストレージを備えたサーバーレスアーキテクチャを使用します。このアーキテクチャはストレージとコンピュートを分離し、独立したスケーリングと個別の課金を可能にします。カラム型ストレージは必要なカラムのみを読み取ることができ、I/Oを大幅に削減するため、分析クエリに最適化されています。
2BigQueryにおけるテーブルパーティショニングの主な利点は何ですか?
2
BigQueryにおけるテーブルパーティショニングの主な利点は何ですか?
回答
パーティショニングは、大きなテーブルをカラム(通常は日付)に基づいて小さなセグメントに分割します。クエリ実行時、BigQueryは関連性のないパーティションをスキップ(partition pruning)し、スキャンされるデータ量を削減します。BigQueryは処理されたデータ量に基づいて課金されるため、これによりパフォーマンスが向上しコストが削減されます。
3BigQueryで利用可能なパーティショニングのタイプは何ですか?
3
BigQueryで利用可能なパーティショニングのタイプは何ですか?
回答
BigQueryは3種類のパーティショニングをサポートしています:DATEまたはTIMESTAMPカラムによるもの(最も一般的)、整数範囲(INTEGER RANGE)によるもの、取り込み時刻(_PARTITIONTIME)によるものです。日付パーティショニングは、日付フィルターで効率的なpartition pruningを可能にするため、時系列データに推奨されます。
4
BigQueryにおけるパーティショニングとクラスタリングの違いは何ですか?
5
BigQueryでクエリコストを最適化する方法は?
+17 面接問題
その他のData Engineering面接トピック
Linux & Shell - 基礎
Junior
20問Git & GitHub - 基礎
Junior
20問データエンジニアリングのための高度なPython
Junior
25問Docker - 基礎
Junior
25問Google Cloud Platform - 基礎
Junior
20問CI/CDとコード品質
Mid-Level
20問Docker Compose
Mid-Level
20問FastAPI - データAPI
Mid-Level
20問Data Engineering向けの高度なSQL
Mid-Level
20問Data Lake - アーキテクチャと取り込み
Mid-Level
20問PostgreSQL - 管理
Mid-Level
20問Data EngineeringのためのData Modeling
Mid-Level
20問Fivetran & Airbyte - データ取り込み
Mid-Level
20問dbt - 基礎
Mid-Level
20問Apache Airflow - 基礎
Mid-Level
20問Kubernetes - 基礎
Mid-Level
20問dbt - 高度な機能
Senior
20問ETL / ELT / ETLT パターン
Senior
20問Apache Airflow - 上級
Senior
20問Airflow + dbt - パイプラインオーケストレーション
Senior
20問PySpark - 大規模処理
Senior
20問Google Pub/Sub - データストリーミング
Senior
20問Apache Beam & Dataflow
Senior
20問Kubernetes - 本番環境とスケーリング
Senior
20問Terraform - Infrastructure as Code
Senior
20問NoSQLデータベース
Senior
20問モダンなData Architecture
Senior
20問モニタリングとオブザーバビリティ
Senior
20問IAMとデータセキュリティ
Senior
20問