AI901-Foundry#23-3
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある製造業企業が、世界 5 リージョンの工場で利用される多言語チャット ボットを Azure AI Foundry で開発します。本社は日本リージョンを基準とし、各工場は日本 / 米国 / EU / インド / 中国地域からアクセスします。可用性 / レイテンシ / 規制 (GDPR / 中国データ保管) を考慮した設計が求められます。
解決策
各リージョンの endpoint に対し PTU で基準容量を予約しスパイク時には Pay-as-you-go でスピル オーバーする構成にして、Azure Monitor で各リージョンの TPM / RPM / レイテンシ / Content Safety 発動率を継続監視、しきい値超過時は SRE チームへアラート通知する観測層を併設します。
この解決策は目的を満たしますか?
ディスカッション 0

コメント

コメントする

目次