MLS-C01#3(ml-operations)

MLS-C01#3(ml-operations)

あるメディア企業は、新バージョンのレコメンドモデルを本番に投入する前に、実際の本番リクエストで品質を比較したいと考えています。ユーザーへの応答品質には影響を与えず、現行モデルの応答を返したまま新モデルの推論結果も並行して計測したいです。最適な機能はどれですか。

ディスカッション 0

正解:C

正解の根拠

SageMaker Shadow Tests (シャドーバリアント) は、本番トラフィックを複製して新モデルへ並行送信し、応答自体はユーザーに返さず計測のみ行う機能です。実トラフィック特性での性能評価が可能で、ユーザー体験を損なうことなく品質比較ができます。

方式ユーザー影響実トラフィック主用途
Shadow テストなしはい事前性能比較
カナリアありはい段階リリース
過去ログ再生なしいいえオフライン検証
マルチモデルありはい多数モデル提供

不正解の理由

  • A: 5% のユーザーには新モデルの応答が返るため、応答品質に影響が出る可能性があります
  • B: 過去ログ再生では実時間トラフィックの分布や負荷特性を再現しきれません
  • D: マルチモデルエンドポイントは多数モデルを効率提供する仕組みで、A/B 比較用途ではありません

参考:Shadow tests


コメント

コメント

コメントする

目次