AI901-Foundry#172-2
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある EC プラットフォームが、出品者がアップロードした商品画像 (1 日 30,000 件) から「カテゴリ自動分類」「ブランド ロゴ検出」「視覚障害者向け alt テキストの自動生成」「規約違反 (アダルト / 暴力 / 著作権侵害) のスクリーニング」を統合的に行うパイプラインを Azure AI Foundry で構築します。要件は分類精度、運用負荷低減、Responsible AI 配慮です。
解決策
1 日 30,000 件すべての画像を GPT-4o multimodal に detail=high で個別に投げ、長文プロンプトで「カテゴリ分類 / ロゴ検出 / alt テキスト生成 / 規約違反判定」をすべて 1 つの自由応答で行わせ、JSON で結果を受け取って Cosmos DB に書き込みます。Azure AI Vision / Custom Vision / Content Safety は使用しません。
この解決策は目的を満たしますか?
解説
【判定: いいえ】の理由
本提案は技術的には動作する可能性があるものの、要件のうち「運用負荷低減」「Responsible AI 配慮」「コスト」を満たせません。GPT-4o multimodal の token 単価は専用 Vision API の数倍〜数十倍で、1 日 30,000 件 × detail=high の運用はコストが莫大に膨らみ、コスト最適化を完全に逸脱します。さらに自由応答形式の LLM は出力フォーマットの揺らぎが生じやすく、カテゴリ / ロゴ / alt / 規約判定を 1 つのプロンプトで返させると JSON Schema 強制 / リトライ / パース処理の独自実装で運用負荷が膨らみます。最も重大なのは Responsible AI 観点で、Azure AI Content Safety を使わずに「規約違反スクリーニング」を LLM の自由判断に任せると、有害コンテンツ検知の体系的なガードレールが欠落し、誤検知 / 見逃しのリスクが大幅に増加します。Microsoft Learn は「定型分類は専用 API、自由応答は LLM、コンテンツ モデレーションは Content Safety」というように適切な API を組み合わせるよう案内しており、本提案はその使い分け原則を完全に無視する誤った設計です。
【「はい」が違う理由】
コスト / 運用負荷 / Responsible AI のいずれも要件を満たせず、設計として失敗です。
本提案は技術的には動作する可能性があるものの、要件のうち「運用負荷低減」「Responsible AI 配慮」「コスト」を満たせません。GPT-4o multimodal の token 単価は専用 Vision API の数倍〜数十倍で、1 日 30,000 件 × detail=high の運用はコストが莫大に膨らみ、コスト最適化を完全に逸脱します。さらに自由応答形式の LLM は出力フォーマットの揺らぎが生じやすく、カテゴリ / ロゴ / alt / 規約判定を 1 つのプロンプトで返させると JSON Schema 強制 / リトライ / パース処理の独自実装で運用負荷が膨らみます。最も重大なのは Responsible AI 観点で、Azure AI Content Safety を使わずに「規約違反スクリーニング」を LLM の自由判断に任せると、有害コンテンツ検知の体系的なガードレールが欠落し、誤検知 / 見逃しのリスクが大幅に増加します。Microsoft Learn は「定型分類は専用 API、自由応答は LLM、コンテンツ モデレーションは Content Safety」というように適切な API を組み合わせるよう案内しており、本提案はその使い分け原則を完全に無視する誤った設計です。
【「はい」が違う理由】
コスト / 運用負荷 / Responsible AI のいずれも要件を満たせず、設計として失敗です。

コメント