ADP#2(data-governance)
データレイク内のデータを生データと加工済みデータで分けて管理したいと考えています。Dataplexで生データを格納するゾーンと、品質保証されたデータを格納するゾーンを作成する場合、それぞれどのZoneタイプを選択しますか。
正解:D
正解の根拠
DataplexのZoneにはRaw zoneとCurated zoneの2種類があり、データのライフサイクル段階に応じて使い分けます。
| Zoneタイプ | 用途 | データ形式 |
|---|---|---|
| Raw zone | 取り込んだままの生データ | 任意の形式 |
| Curated zone | クレンジング済み構造化データ | Parquet、Avro、ORC、BigQuery |
不正解の理由
- RawとCuratedの役割が逆になっています
- 同一Zoneでアセットだけで区別すると品質要件が混在します
- タグだけでの区別はZoneのスキーマ強制機能を活用できません

コメント