AI901-Foundry#179
Vision アプリで「推論レイテンシが急に悪化した」と報告された場合、調査・対処として適切なものを 2 つ選択してください。
2 つ選択してください
解説
【正解: A, C】の理由
A は SRE 観点の根本対処で、Azure Monitor / Application Insights でメトリックを時系列分析することによりボトルネック (モデル推論 / ネットワーク / ストレージ / リクエスト サイズ) を特定し、適切な対処に進めます。C は GPT-4o multimodal を使う場合の代表的なレイテンシ / コスト最適化で、detail=low に切り替えるか、画像サイズを推奨範囲 (例: 2048×768) 以内に縮小することで prompt token とレイテンシを大幅に削減できます。両者は Microsoft 公式の Vision アプリ運用ガイドの基本対処です。
【他選択肢が違う理由】
A は SRE 観点の根本対処で、Azure Monitor / Application Insights でメトリックを時系列分析することによりボトルネック (モデル推論 / ネットワーク / ストレージ / リクエスト サイズ) を特定し、適切な対処に進めます。C は GPT-4o multimodal を使う場合の代表的なレイテンシ / コスト最適化で、detail=low に切り替えるか、画像サイズを推奨範囲 (例: 2048×768) 以内に縮小することで prompt token とレイテンシを大幅に削減できます。両者は Microsoft 公式の Vision アプリ運用ガイドの基本対処です。
【他選択肢が違う理由】
- B: API キー変更は認証の話で、レイテンシには無関係です。
- D: portal 再起動操作はありません。
- E: TTL 0 は逆効果です。

コメント