PDE#5(analyzing)

PDE#5(analyzing)

あるグローバル企業は AWS S3 にイベントログを蓄積していますが、分析チームは BigQuery の SQL で AWS データを直接クエリしたいと考えています。データを GCS にコピーする運用コストや遅延は避けたいです。最適なアプローチはどれですか?

ディスカッション 0

正解:D

正解の根拠

BigQuery Omni は AWS や Azure のオブジェクトストレージを BigQuery の SQL から直接クエリできるマルチクラウド分析機能です。データを GCS にコピーする必要がなく、データレジデンシー要件のあるシナリオでも S3 を移動させずに分析でき、ETL 遅延と運用コストを大幅に削減できます。アナリストは慣れ親しんだ BigQuery のインターフェースで作業を継続できます。

サービス比較

項目BigQuery OmniStorage Transfer Service
データ移動不要必要
遅延クエリ時転送頻度依存
運用転送ジョブ管理

不正解の理由

  • A: 日次コピーは鮮度が低下し、データ重複保管のコストも発生します。
  • C: Dataflow も結局データ移動を伴い、レジデンシー要件があると採用しづらいです。
  • B: Cloud Run + AWS CLI はスケールしにくく、運用負荷が高く本格分析基盤には不適です。

参考:Introduction to BigQuery Omni


コメント

コメント

コメントする

目次