AI901-Foundry#21
大規模本番ワークロード (1 日 100 万呼び出し) で安定レイテンシと予算予測を両立したい場合、最適なデプロイ オプションはどれですか?
解説
【正解: A】の理由
PTU は専有スループットを予約購入し安定レイテンシと予算確定を保証するモデルで、PTU + Pay-as-you-go のハイブリッド構成は大規模ワークロードでの Microsoft 推奨パターンです。基準容量で安定運用しつつ、突発的なピーク時は弾力性を確保できます。
【他選択肢が違う理由】
PTU は専有スループットを予約購入し安定レイテンシと予算確定を保証するモデルで、PTU + Pay-as-you-go のハイブリッド構成は大規模ワークロードでの Microsoft 推奨パターンです。基準容量で安定運用しつつ、突発的なピーク時は弾力性を確保できます。
【他選択肢が違う理由】
- B: 従量のみではレイテンシ / 予算が不安定です。
- C: ローカル運用は foundation model のクラウド前提と矛盾します。
- D: VM 自前推論は非効率です。

コメント