PDE#1(ingesting)
あるグローバル EC 企業は、世界中の Web サーバから 1 秒あたり最大 50 万件のクリックストリームイベントを Google Cloud に取り込みます。発行元と購読側で順序保証が必要なのは、同一ユーザー単位での行動分析を行うときだけで、グローバルな順序は不要です。また、過去 7 日間のメッセージは再処理可能とし、購読側 Dataflow が一時的に停止しても消失しない設計が求められます。最適な構成は次のどれですか?
正解:D
正解の根拠
Pub/Sub の順序指定キーを使うと、同じキーを持つメッセージは発行順に配信されます。ユーザー ID をキーにすることでユーザー単位の順序保証が得られ、グローバル順序を強制しないためスループットも維持できます。メッセージ保持期間を 7 日に設定すれば、購読側障害時にもシーク機能で再処理が可能です。
サービス比較
| 項目 | Pub/Sub 順序キー (B) | Pub/Sub Lite (A) |
|---|---|---|
| スケール | 自動、グローバル | 事前にパーティション容量を設計 |
| 順序単位 | キー単位 | パーティション単位 |
| 保持 | 最大 7 日 | 容量ベース |
不正解の理由
- A: Pub/Sub Lite はゾーンリージョン製品で容量管理が必要、グローバル要件と運用負荷で不利です。
- C: Dataflow 側だけのグルーピングでは取り込み順が崩れる場合があり、ユーザー単位の順序保証になりません。
- B: Cloud Storage バッチは秒次の取り込みやリアルタイム再処理要件を満たせず、要件不一致です。

コメント