AI901-Foundry#192
PDF 内の複雑な表 (結合セル / 複数ヘッダー / 改ページに跨る表) から行 / 列 / セルを抽出したい場合、Microsoft が推奨する最も適切な選択肢はどれですか?
解説
【正解: B】の理由
Document Intelligence の prebuilt-layout (および custom neural) は、結合セルや複数ヘッダーを含む複雑な表構造を、tables プロパティの行 / 列 / セル / column span / row span / 跨ページ表として構造化 JSON で返します。Microsoft Learn の Layout model documentation に表抽出仕様が記載されており、財務報告書 / 仕様書 / 規制文書のような表中心の文書を業務システム連携する場合に必須の機能です。
【他選択肢が違う理由】
Document Intelligence の prebuilt-layout (および custom neural) は、結合セルや複数ヘッダーを含む複雑な表構造を、tables プロパティの行 / 列 / セル / column span / row span / 跨ページ表として構造化 JSON で返します。Microsoft Learn の Layout model documentation に表抽出仕様が記載されており、財務報告書 / 仕様書 / 規制文書のような表中心の文書を業務システム連携する場合に必須の機能です。
【他選択肢が違う理由】
- A: Read API は行 / 単語の OCR で、表構造は扱いません。
- C / D: 翻訳 / 音声合成は表抽出とは無関係です。

コメント