AI901-Concept#100 | CloudCamp｜クラウド資格のWEB問題集

MENU

会員登録（無料）

AI901-Concept#100

本番アプリで Azure OpenAI 推論レイテンシを短縮したい場合、最も効果的かつ実用的な対策はどれですか?

A. max_tokens を必要十分な値に絞り、stream モードで部分生成を逐次受信する B. 全推論を temperature 2.0 に設定する C. API キーをローテーションする頻度を上げる D. Azure リソースの名前を短くする

ディスカッション 0

コメント

コメントするコメントをキャンセル