AI901-Concept#63-1
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある小売企業が、店舗端末上で動作する商品問い合わせ支援 AI を Microsoft Foundry で構築しようとしています。端末はインターネット接続が限定的で、低レイテンシかつ低コストでの推論を必要とします。Foundry model catalog のどのモデルを選ぶかが論点です。
解決策
Microsoft Phi-4 を選択し、必要に応じてオンデバイス推論または近接エッジ デプロイで運用する設計を採用します。
この解決策は目的を満たしますか?
解説
【判定: はい】の理由
Microsoft Phi シリーズは数億〜数十億パラメータ規模の SLM で、エッジ / オンデバイス / オンプレ推論に最適化されています。Foundry model catalog から取得可能で、店舗端末のような帯域・電力に制約のある環境でも実用的なレイテンシで動作します。商品問い合わせのような限定的なタスクであれば、特定ドメインで fine-tune することで GPT-4o 等の LLM に近い精度を達成しつつ、推論コストとレイテンシを大幅に削減できます。Foundry SDK で同じ API パターンで呼び出せるため、開発体験もマルチモデル間で一貫します。
【「いいえ」が違う理由】
本ソリューションはエッジ / 低レイテンシ要件に対する SLM 活用の典型パターンで、Foundry model catalog の設計意図にも合致します。「目的を満たさない」と判断する根拠はありません。
Microsoft Phi シリーズは数億〜数十億パラメータ規模の SLM で、エッジ / オンデバイス / オンプレ推論に最適化されています。Foundry model catalog から取得可能で、店舗端末のような帯域・電力に制約のある環境でも実用的なレイテンシで動作します。商品問い合わせのような限定的なタスクであれば、特定ドメインで fine-tune することで GPT-4o 等の LLM に近い精度を達成しつつ、推論コストとレイテンシを大幅に削減できます。Foundry SDK で同じ API パターンで呼び出せるため、開発体験もマルチモデル間で一貫します。
【「いいえ」が違う理由】
本ソリューションはエッジ / 低レイテンシ要件に対する SLM 活用の典型パターンで、Foundry model catalog の設計意図にも合致します。「目的を満たさない」と判断する根拠はありません。

コメント