AI901-Foundry#147-3
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある金融機関が、紙の融資申込書 (1 日 2,000 件、A4 で 5〜10 ページ、手書き + 印刷混在、日本語) を OCR で電子化し、後段のシステムに「氏名・住所・電話番号・年収・希望金額」を構造化して渡したいと考えています。要件は正確な構造化抽出、業界専門用語 (融資商品コード 等) への対応、Privacy and security 配慮 (PII 取扱) です。
解決策
基本構成 (Document Intelligence custom + Language PII detection) に加え、低 confidence で抽出された項目だけを Foundry の GPT-4o multimodal にスキャン画像と OCR 結果をセットで送り、「曖昧な手書きや略字の解釈」を Human-in-the-loop の代替として LLM に補強させる 2 段検証フローを構築します。
この解決策は目的を満たしますか?
ディスカッション 0

コメント

コメントする

目次