DP-900-CORE#97-3 | CloudCamp｜クラウド資格のWEB問題集

DP-900-CORE#97-3

注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。

前提

アプリケーションが扱う様々なデータについて、データ分類 (構造化 / 半構造化 / 非構造化) が正しく行われているかを判定してください。分類により、適切なストア (RDB / NoSQL / Blob) とクエリ手段 (SQL / API / AI) を選択する必要があります。

解決策

Azure Blob Storage に保存された PDF レポート (社内会議録、自由フォーマット) を、スキーマがなく内容そのものを解釈する必要があるため非構造化データとして分類し、Azure AI Services で OCR + 要約してから分析する。

この分類は正しいですか?

A.はい B.いいえ

ディスカッション 0

解説

【判定: はい】の理由
PDF レポート (自由フォーマット) は非構造化データの典型例で、AI 経由の構造化が定石です。

段階	サービス	処理
1. 格納	Azure Blob Storage	非構造化 PDF をそのまま保管
2. 構造化抽出	Azure AI Document Intelligence (Form Recognizer)	OCR + レイアウト解析 + 要素抽出
3. 要約	Azure OpenAI / Language Service	議事録要約 + キートピック抽出
4. 分析	Synapse / Fabric Notebook	抽出済構造化データを分析

非構造化データはそのままでは分析不可で、AI による構造化抽出が必須です。本設計はその正しいパイプラインです。

【「いいえ」が違う理由】
PDF は内容が自由フォーマットで、固定スキーマもキー/値構造もないため、構造化や半構造化に分類するのは誤りです。本設計の非構造化分類は正確で、AI による構造化抽出フローも適切です。

出典: Microsoft Learn — Explore core data concepts › Unstructured data

解説

コメント

コメントするコメントをキャンセル

解説

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル