AI901-Foundry#147-1
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある金融機関が、紙の融資申込書 (1 日 2,000 件、A4 で 5〜10 ページ、手書き + 印刷混在、日本語) を OCR で電子化し、後段のシステムに「氏名・住所・電話番号・年収・希望金額」を構造化して渡したいと考えています。要件は正確な構造化抽出、業界専門用語 (融資商品コード 等) への対応、Privacy and security 配慮 (PII 取扱) です。
解決策
申込書のスキャン PDF を Blob にアップロードし、Azure AI Document Intelligence の custom model を「申込書テンプレート」用に訓練して構造化抽出を実装、抽出結果を Azure AI Language の PII detection でマスクしてから業務システムに連携する設計とします。Vision の Read API は Document Intelligence の内部 OCR として活用されます。
この解決策は目的を満たしますか?
ディスカッション 0

コメント

コメントする

目次