PMLE#3(serving-scaling)

PMLE#3(serving-scaling)

新しいモデルをリリースする際に、本番トラフィックの 10 パーセントだけを新バージョンへ流して安全性を確認したいです。Vertex AI Endpoints で適切な機能はどれですか。

ディスカッション 0

正解:A

正解の根拠

Vertex AI Endpoint は単一エンドポイント上で複数の DeployedModel に対する traffic_split を設定でき、Canary や A/B テストを安全に実施できます。新旧モデルが同一エンドポイントを共有するため切替も即時です。

パターン仕組み
Canary新モデルへ 10 パーセント流して検証
A/B テスト50/50 でメトリクス比較
Blue/Green0 から 100 へ即時切替

不正解の理由

  • B は DNS 伝播待ちで即時切戻しが困難です。
  • C はオンライン用途では成立しません。
  • D はトラフィック分割そのものを行いません。

参考:Vertex AI モデルのデプロイ


コメント

コメント

コメントする

目次