AI901-Foundry#144
Read API の OCR レスポンスに含まれる主要な情報として、最も適切な説明はどれですか?
解説
【正解: B】の理由
Read API の analyzeResult はページ単位 (
【他選択肢が違う理由】
Read API の analyzeResult はページ単位 (
pages[]) の構造で返り、各ページに幅 / 高さ / 単位 (pixel / inch)、lines[] (行テキストと bounding polygon)、words[] (単語テキスト / bounding box / confidence) を含みます。順序は左→右 / 上→下を基本に、複数段組レイアウトでも妥当な読み取り順に並び替えられるため、後段の Document Intelligence / 業務システムへの取り込みが容易です。【他選択肢が違う理由】
- A: 話者ラベル / 感情は Speech / Language の領域です。
- C: 音声仕様は Vision とは別概念です。
- D: ストレージ遷移ログは Vision の出力ではありません。

コメント