AI901-Concept#63-2
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある小売企業が、店舗端末上で動作する商品問い合わせ支援 AI を Microsoft Foundry で構築しようとしています。端末はインターネット接続が限定的で、低レイテンシかつ低コストでの推論を必要とします。Foundry model catalog のどのモデルを選ぶかが論点です。
解決策
高精度を最優先するため GPT-4o を選択し、すべての店舗端末からインターネット経由で Azure OpenAI のグローバル エンドポイントを毎リクエスト呼び出します。
この解決策は目的を満たしますか?
解説
【判定: いいえ】の理由
店舗端末の「インターネット接続が限定的 / 低レイテンシ / 低コスト」という制約と矛盾します。GPT-4o は推論コストが SLM より大幅に高く、ネットワーク往復のレイテンシも 100〜500ms 程度発生し、回線が不安定な店舗ではタイムアウトや無応答が頻発します。商品問い合わせのような定型タスクには過剰スペックでもあり、コスト・体験・運用安定性のどの観点でも妥当性を欠きます。要件に応じた SLM (Phi-4 等) のエッジ展開を選択するのが正解です。
【「はい」が違う理由】
精度面では GPT-4o が優位ですが、本シナリオの非機能要件 (帯域 / レイテンシ / コスト) を満たせず、設計判断として失格です。店舗運営の品質低下を招くため、「目的を満たす」とは言えません。 Foundry SDK で店舗 KPI に応じた評価を行う観点でも明らかに不適切な設計です。
店舗端末の「インターネット接続が限定的 / 低レイテンシ / 低コスト」という制約と矛盾します。GPT-4o は推論コストが SLM より大幅に高く、ネットワーク往復のレイテンシも 100〜500ms 程度発生し、回線が不安定な店舗ではタイムアウトや無応答が頻発します。商品問い合わせのような定型タスクには過剰スペックでもあり、コスト・体験・運用安定性のどの観点でも妥当性を欠きます。要件に応じた SLM (Phi-4 等) のエッジ展開を選択するのが正解です。
【「はい」が違う理由】
精度面では GPT-4o が優位ですが、本シナリオの非機能要件 (帯域 / レイテンシ / コスト) を満たせず、設計判断として失格です。店舗運営の品質低下を招くため、「目的を満たす」とは言えません。 Foundry SDK で店舗 KPI に応じた評価を行う観点でも明らかに不適切な設計です。

コメント