AI901-Concept#47-1
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある企業が長文の社内ドキュメント (1 件あたり約 30,000 文字) を Azure OpenAI で要約するアプリケーションを Microsoft Foundry SDK で構築しています。モデルのコンテキスト ウィンドウとトークン経済性を踏まえた設計が必要です。
解決策
Azure OpenAI のモデルとして 128K トークンのコンテキスト ウィンドウを持つ GPT-4o を選択し、ドキュメント全体を 1 回のプロンプトで投入して要約を生成します。
この解決策は目的を満たしますか?
解説
【判定: はい】の理由
128K トークン (約 50 万文字相当) のコンテキスト ウィンドウは、30,000 文字程度の日本語ドキュメントを楽に収容できます。文書を分割せず一度に渡せるため、文書全体の文脈を保持した上で要約が可能で、情報の取りこぼしや章間矛盾も避けられます。Foundry SDK で AzureOpenAI クライアントから直接呼び出せ、トークン使用量は usage 属性で計測でき、コスト管理も容易です。長文 RAG 不要のケースで適切な選択肢になります。トークン経済性も含めた設計判断として、Microsoft 公式の長 context モデル活用ガイドにも合致します。
【「いいえ」が違う理由】
本ケースでは文書サイズが context window 内に収まるため、分割不要で 1 回呼び出しが最も効率的です。Foundry の AzureOpenAI クライアントは context window 利用効率を最大化できるため、「目的を満たさない」と判定する根拠は無く、設計判断として妥当です。
128K トークン (約 50 万文字相当) のコンテキスト ウィンドウは、30,000 文字程度の日本語ドキュメントを楽に収容できます。文書を分割せず一度に渡せるため、文書全体の文脈を保持した上で要約が可能で、情報の取りこぼしや章間矛盾も避けられます。Foundry SDK で AzureOpenAI クライアントから直接呼び出せ、トークン使用量は usage 属性で計測でき、コスト管理も容易です。長文 RAG 不要のケースで適切な選択肢になります。トークン経済性も含めた設計判断として、Microsoft 公式の長 context モデル活用ガイドにも合致します。
【「いいえ」が違う理由】
本ケースでは文書サイズが context window 内に収まるため、分割不要で 1 回呼び出しが最も効率的です。Foundry の AzureOpenAI クライアントは context window 利用効率を最大化できるため、「目的を満たさない」と判定する根拠は無く、設計判断として妥当です。

コメント