AI901-Concept#78-1
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある EC 企業が、商品検索チャット ボットを Azure AI Foundry にデプロイし、ピーク時 (年末セール) は通常時の 10 倍のトラフィックを処理する必要があります。安定したレイテンシと予算予測可能性を両立する必要があります。
解決策
ピーク時の基準容量を Provisioned Throughput Unit (PTU) で確保し、PTU 容量を超えた分は従量課金 (Pay-as-you-go) にスピル オーバーするハイブリッド構成を Foundry portal で設定します。
この解決策は目的を満たしますか?
ディスカッション 0

コメント

コメントする

目次