DP-900-CORE#72
ある企業が IoT センサーから 1 秒あたり数千件のデータを取り込み、後で分析する目的で保存しています。データはほぼスキーマレスで、フィールド構成も時間とともに変化します。このデータは次のうちどれに分類されますか?
解説
【正解: B】の理由
半構造化データは「スキーマあり (タグ/属性) だが柔軟」が定義です。IoT センサーが送る JSON は「タイムスタンプ + デバイス ID + 計測値」の基本構造を持ちつつ、新センサー追加でフィールド構成が変化する柔軟性が必要なため半構造化に該当します。
格納先は Cosmos DB (NoSQL) や Azure Blob Storage の JSON 形式が最適です。
【他選択肢が違う理由】
出典: Microsoft Learn — Explore core data concepts › Semi-structured data
半構造化データは「スキーマあり (タグ/属性) だが柔軟」が定義です。IoT センサーが送る JSON は「タイムスタンプ + デバイス ID + 計測値」の基本構造を持ちつつ、新センサー追加でフィールド構成が変化する柔軟性が必要なため半構造化に該当します。
| 分類 | 特徴 | 典型例 |
|---|---|---|
| 構造化 | 固定スキーマ・行と列・型強制 | RDB テーブル、列定義 CSV |
| 半構造化 | スキーマあり (タグ/キー) + 柔軟 | JSON / XML / YAML / IoT JSON ストリーム |
| 非構造化 | スキーマなし | 画像・動画・音声・自由文書 |
格納先は Cosmos DB (NoSQL) や Azure Blob Storage の JSON 形式が最適です。
【他選択肢が違う理由】
- A. 構造化: 固定スキーマと型強制が必須となるため、フィールドが変化する IoT データには適しません。
- C. 非構造化: 画像 / 動画 / 音声などスキーマがゼロのデータが対象であり、キー構造を持つ IoT JSON には該当しません。
- D. リレーショナル データ: テーブルと関係の概念を指し、構造化 / 半構造化 / 非構造化と並列の分類ではありません。
出典: Microsoft Learn — Explore core data concepts › Semi-structured data

コメント