PDE#5(analyzing)
あるグローバル企業は AWS S3 にイベントログを蓄積していますが、分析チームは BigQuery の SQL で AWS データを直接クエリしたいと考えています。データを GCS にコピーする運用コストや遅延は避けたいです。最適なアプローチはどれですか?
正解:D
正解の根拠
BigQuery Omni は AWS や Azure のオブジェクトストレージを BigQuery の SQL から直接クエリできるマルチクラウド分析機能です。データを GCS にコピーする必要がなく、データレジデンシー要件のあるシナリオでも S3 を移動させずに分析でき、ETL 遅延と運用コストを大幅に削減できます。アナリストは慣れ親しんだ BigQuery のインターフェースで作業を継続できます。
サービス比較
| 項目 | BigQuery Omni | Storage Transfer Service |
|---|---|---|
| データ移動 | 不要 | 必要 |
| 遅延 | クエリ時 | 転送頻度依存 |
| 運用 | 低 | 転送ジョブ管理 |
不正解の理由
- A: 日次コピーは鮮度が低下し、データ重複保管のコストも発生します。
- C: Dataflow も結局データ移動を伴い、レジデンシー要件があると採用しづらいです。
- B: Cloud Run + AWS CLI はスケールしにくく、運用負荷が高く本格分析基盤には不適です。

コメント