AI901-Concept#78-1
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある EC 企業が、商品検索チャット ボットを Azure AI Foundry にデプロイし、ピーク時 (年末セール) は通常時の 10 倍のトラフィックを処理する必要があります。安定したレイテンシと予算予測可能性を両立する必要があります。
解決策
ピーク時の基準容量を Provisioned Throughput Unit (PTU) で確保し、PTU 容量を超えた分は従量課金 (Pay-as-you-go) にスピル オーバーするハイブリッド構成を Foundry portal で設定します。
この解決策は目的を満たしますか?
解説
【判定: はい】の理由
PTU + Pay-as-you-go のハイブリッド構成は、Microsoft が公式に推奨する大規模ワークロード向けデザイン パターンです。PTU で基準スループットを予約することで安定した低レイテンシと予算確定を獲得し、突発的なピーク時にはスピル オーバーで弾力性を確保できます。これにより、年末セールのようなトラフィック変動に対しても断りなしに応答し続けつつ、ピーク以外の常時運用は予算内に収まります。Foundry portal の deployment 設定でこの構成は標準的に組めます。
【「いいえ」が違う理由】
本ソリューションは安定性とコスト予測の両立という設計目的に直接合致し、Microsoft 公式のベスト プラクティスです。「目的を満たさない」と判断する根拠はありません。 EC の繁忙期運用に必要なすべての非機能要件を満たす設計判断です。 Microsoft 公式のリファレンス アーキテクチャでも同等の構成が推奨されています。
PTU + Pay-as-you-go のハイブリッド構成は、Microsoft が公式に推奨する大規模ワークロード向けデザイン パターンです。PTU で基準スループットを予約することで安定した低レイテンシと予算確定を獲得し、突発的なピーク時にはスピル オーバーで弾力性を確保できます。これにより、年末セールのようなトラフィック変動に対しても断りなしに応答し続けつつ、ピーク以外の常時運用は予算内に収まります。Foundry portal の deployment 設定でこの構成は標準的に組めます。
【「いいえ」が違う理由】
本ソリューションは安定性とコスト予測の両立という設計目的に直接合致し、Microsoft 公式のベスト プラクティスです。「目的を満たさない」と判断する根拠はありません。 EC の繁忙期運用に必要なすべての非機能要件を満たす設計判断です。 Microsoft 公式のリファレンス アーキテクチャでも同等の構成が推奨されています。

コメント