AI901-Concept#150-2
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある食品製造企業が、生産ラインの完成品を撮影した画像から不良品 (キズ / 異物混入 / 形状異常) を自動検出する品質管理 AI を Azure AI Foundry で構築します。1 日 10 万枚の画像を処理し、不良品のみオペレーターが目視確認するワークフローを実現したいと考えています。
解決策
Azure AI Speech の speech-to-text API で各製品の画像を分析し、不良品を分類するパイプラインを構築します。
この解決策は目的を満たしますか?
解説
【判定: いいえ】の理由
Azure AI Speech の speech-to-text は音声入力をテキストに変換する音声認識サービスで、画像入力には適用できません。画像分析には Azure AI Vision の image analysis または custom vision を使う必要があります。本提案は入力モダリティ (画像) とサービス機能 (音声 → テキスト) の根本的なミスマッチで、技術的に機能しません。AI ワークロードの選定では入力データの種類 (テキスト / 画像 / 音声 / 動画) と必要処理 (分類 / 抽出 / 生成 / 検出) を組み合わせて適切なサービスを選ぶことが基本で、本シナリオではモダリティの選定誤りが致命的です。
【「はい」が違う理由】
音声 API で画像を処理することは技術的に不可能で、本提案は実装段階で完全に動作しません。「目的を満たす」と判定する根拠は皆無です。
Azure AI Speech の speech-to-text は音声入力をテキストに変換する音声認識サービスで、画像入力には適用できません。画像分析には Azure AI Vision の image analysis または custom vision を使う必要があります。本提案は入力モダリティ (画像) とサービス機能 (音声 → テキスト) の根本的なミスマッチで、技術的に機能しません。AI ワークロードの選定では入力データの種類 (テキスト / 画像 / 音声 / 動画) と必要処理 (分類 / 抽出 / 生成 / 検出) を組み合わせて適切なサービスを選ぶことが基本で、本シナリオではモダリティの選定誤りが致命的です。
【「はい」が違う理由】
音声 API で画像を処理することは技術的に不可能で、本提案は実装段階で完全に動作しません。「目的を満たす」と判定する根拠は皆無です。

コメント