ADP#2(data-governance)

ADP#2(data-governance)

データレイク内のデータを生データと加工済みデータで分けて管理したいと考えています。Dataplexで生データを格納するゾーンと、品質保証されたデータを格納するゾーンを作成する場合、それぞれどのZoneタイプを選択しますか。

ディスカッション 0

正解:D

正解の根拠

DataplexのZoneにはRaw zoneとCurated zoneの2種類があり、データのライフサイクル段階に応じて使い分けます。

Zoneタイプ用途データ形式
Raw zone取り込んだままの生データ任意の形式
Curated zoneクレンジング済み構造化データParquet、Avro、ORC、BigQuery

不正解の理由

  • RawとCuratedの役割が逆になっています
  • 同一Zoneでアセットだけで区別すると品質要件が混在します
  • タグだけでの区別はZoneのスキーマ強制機能を活用できません

参考:Dataplex ゾーンの追加


コメント

コメント

コメントする

目次