AI901-Foundry#147-2
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある金融機関が、紙の融資申込書 (1 日 2,000 件、A4 で 5〜10 ページ、手書き + 印刷混在、日本語) を OCR で電子化し、後段のシステムに「氏名・住所・電話番号・年収・希望金額」を構造化して渡したいと考えています。要件は正確な構造化抽出、業界専門用語 (融資商品コード 等) への対応、Privacy and security 配慮 (PII 取扱) です。
解決策
Read API のみを呼び出し、戻ってきた行テキストを正規表現で氏名 / 住所 / 電話 / 年収 / 金額にマッピングします。Document Intelligence や Language の PII detection は使わず、ソース コード内に PII を平文で保持します。
この解決策は目的を満たしますか?
ディスカッション 0

コメント

コメントする

目次