AI901-Concept#119-2
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある報道機関が、毎日 1 万件以上の英語ニュース記事を収集・分類・検索する社内ナレッジ ベースを Azure AI Foundry で構築しています。記事から主要トピック / 関連企業 / 関係人物 / 発生日付を自動抽出して構造化メタデータとして検索できる状態にする必要があります。
解決策
テキスト処理を一切使わず、Azure AI Vision の OCR 機能のみで記事の主要トピックと人物名 / 企業名を抽出するパイプラインを構築します。
この解決策は目的を満たしますか?
解説
【判定: いいえ】の理由
ニュース記事は既に テキスト形式 で取得されている前提のシナリオであり、OCR (Optical Character Recognition) は不要です。OCR は画像内に印刷された文字をテキスト化する機能で、最初からテキスト形式のニュースに対しては効果がなく、むしろ画像変換 / OCR 処理のステップが無駄になります。さらに OCR は単にテキストを取り出すだけで、key phrase / entity の意味抽出は別途必要です。要件を満たすには Azure AI Language の text analysis 機能 (key phrase extraction + NER) を直接適用するのが正解で、ワークロード カテゴリーの選定を完全に誤っています。
【「はい」が違う理由】
入力モダリティと要件 (テキスト→構造化メタデータ) を見れば computer vision の OCR は不適切で、text analysis サービスを採用すべきです。「目的を満たす」と判定するのは技術的に誤りです。
ニュース記事は既に テキスト形式 で取得されている前提のシナリオであり、OCR (Optical Character Recognition) は不要です。OCR は画像内に印刷された文字をテキスト化する機能で、最初からテキスト形式のニュースに対しては効果がなく、むしろ画像変換 / OCR 処理のステップが無駄になります。さらに OCR は単にテキストを取り出すだけで、key phrase / entity の意味抽出は別途必要です。要件を満たすには Azure AI Language の text analysis 機能 (key phrase extraction + NER) を直接適用するのが正解で、ワークロード カテゴリーの選定を完全に誤っています。
【「はい」が違う理由】
入力モダリティと要件 (テキスト→構造化メタデータ) を見れば computer vision の OCR は不適切で、text analysis サービスを採用すべきです。「目的を満たす」と判定するのは技術的に誤りです。

コメント