Data Engineering

データエンジニアリングのためのBigQuery

サーバーレスアーキテクチャ、パーティショニング、クラスタリング、コスト、UDF、federated queries、scheduled queries、materialized views

20 面接問題·
Mid-Level
1

BigQueryはどのストレージアーキテクチャを使用しますか?

回答

BigQueryは、Capacitorと呼ばれるカラム型ストレージを備えたサーバーレスアーキテクチャを使用します。このアーキテクチャはストレージとコンピュートを分離し、独立したスケーリングと個別の課金を可能にします。カラム型ストレージは必要なカラムのみを読み取ることができ、I/Oを大幅に削減するため、分析クエリに最適化されています。

2

BigQueryにおけるテーブルパーティショニングの主な利点は何ですか?

回答

パーティショニングは、大きなテーブルをカラム(通常は日付)に基づいて小さなセグメントに分割します。クエリ実行時、BigQueryは関連性のないパーティションをスキップ(partition pruning)し、スキャンされるデータ量を削減します。BigQueryは処理されたデータ量に基づいて課金されるため、これによりパフォーマンスが向上しコストが削減されます。

3

BigQueryで利用可能なパーティショニングのタイプは何ですか?

回答

BigQueryは3種類のパーティショニングをサポートしています:DATEまたはTIMESTAMPカラムによるもの(最も一般的)、整数範囲(INTEGER RANGE)によるもの、取り込み時刻(_PARTITIONTIME)によるものです。日付パーティショニングは、日付フィルターで効率的なpartition pruningを可能にするため、時系列データに推奨されます。

4

BigQueryにおけるパーティショニングとクラスタリングの違いは何ですか?

5

BigQueryでクエリコストを最適化する方法は?

+17 面接問題

次の面接に向けてData Engineeringをマスター

すべての問題、flashcards、技術テスト、コードレビュー演習、面接シミュレーターにアクセス。

無料で始める