DP-900-CORE#97-3
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
アプリケーションが扱う様々なデータについて、データ分類 (構造化 / 半構造化 / 非構造化) が正しく行われているかを判定してください。分類により、適切なストア (RDB / NoSQL / Blob) とクエリ手段 (SQL / API / AI) を選択する必要があります。
解決策
Azure Blob Storage に保存された PDF レポート (社内会議録、自由フォーマット) を、スキーマがなく内容そのものを解釈する必要があるため非構造化データとして分類し、Azure AI Services で OCR + 要約してから分析する。
この分類は正しいですか?
解説
【判定: はい】の理由
PDF レポート (自由フォーマット) は非構造化データの典型例で、AI 経由の構造化が定石です。
非構造化データはそのままでは分析不可で、AI による構造化抽出が必須です。本設計はその正しいパイプラインです。
【「いいえ」が違う理由】
PDF は内容が自由フォーマットで、固定スキーマもキー/値構造もないため、構造化や半構造化に分類するのは誤りです。本設計の非構造化分類は正確で、AI による構造化抽出フローも適切です。
出典: Microsoft Learn — Explore core data concepts › Unstructured data
PDF レポート (自由フォーマット) は非構造化データの典型例で、AI 経由の構造化が定石です。
| 段階 | サービス | 処理 |
|---|---|---|
| 1. 格納 | Azure Blob Storage | 非構造化 PDF をそのまま保管 |
| 2. 構造化抽出 | Azure AI Document Intelligence (Form Recognizer) | OCR + レイアウト解析 + 要素抽出 |
| 3. 要約 | Azure OpenAI / Language Service | 議事録要約 + キー トピック抽出 |
| 4. 分析 | Synapse / Fabric Notebook | 抽出済構造化データを分析 |
非構造化データはそのままでは分析不可で、AI による構造化抽出が必須です。本設計はその正しいパイプラインです。
【「いいえ」が違う理由】
PDF は内容が自由フォーマットで、固定スキーマもキー/値構造もないため、構造化や半構造化に分類するのは誤りです。本設計の非構造化分類は正確で、AI による構造化抽出フローも適切です。
出典: Microsoft Learn — Explore core data concepts › Unstructured data

コメント