MLS-C01#3(ml-operations)

あるメディア企業は、新バージョンのレコメンドモデルを本番に投入する前に、実際の本番リクエストで品質を比較したいと考えています。ユーザーへの応答品質には影響を与えず、現行モデルの応答を返したまま新モデルの推論結果も並行して計測したいです。最適な機能はどれですか。

正解と解説ディスカッション 0

正解：C

SageMaker Shadow Tests (シャドーバリアント) は、本番トラフィックを複製して新モデルへ並行送信し、応答自体はユーザーに返さず計測のみ行う機能です。実トラフィック特性での性能評価が可能で、ユーザー体験を損なうことなく品質比較ができます。

方式	ユーザー影響	実トラフィック	主用途
Shadow テスト	なし	はい	事前性能比較
カナリア	あり	はい	段階リリース
過去ログ再生	なし	いいえ	オフライン検証
マルチモデル	あり	はい	多数モデル提供

コメント