PMLE#3(serving-scaling)
新しいモデルをリリースする際に、本番トラフィックの 10 パーセントだけを新バージョンへ流して安全性を確認したいです。Vertex AI Endpoints で適切な機能はどれですか。
正解:A
正解の根拠
Vertex AI Endpoint は単一エンドポイント上で複数の DeployedModel に対する traffic_split を設定でき、Canary や A/B テストを安全に実施できます。新旧モデルが同一エンドポイントを共有するため切替も即時です。
| パターン | 仕組み |
|---|---|
| Canary | 新モデルへ 10 パーセント流して検証 |
| A/B テスト | 50/50 でメトリクス比較 |
| Blue/Green | 0 から 100 へ即時切替 |
不正解の理由
- B は DNS 伝播待ちで即時切戻しが困難です。
- C はオンライン用途では成立しません。
- D はトラフィック分割そのものを行いません。

コメント