PDE#2(maintaining)

PDE#2(maintaining)

金融サービス企業が複数の BigQuery データセットに対して、データ品質ルール(NOT NULL、範囲チェック、参照整合性)を統一的に適用したいと考えています。ルール定義は YAML で管理し、毎日スキャン結果をダッシュボードで確認、違反時には監査ログに記録する必要があります。最適なソリューションはどれですか?

ディスカッション 0

正解:A

正解の根拠

Dataplex Data Quality は YAML 形式でルールを宣言し、BigQuery テーブルに対してマネージドなスキャンを実行するサービスです。結果は自動的に BigQuery と Cloud Logging に出力され、Looker Studio ダッシュボードに統合可能です。違反時は Cloud Monitoring アラートと連携できるため、宣言的かつ運用負荷の低い品質管理が実現します。

サービス比較

項目Dataplex DQComposer 自作
ルール定義宣言的 YAMLPython コード
結果保存自動 BQ 出力独自実装
監査ログ標準連携追加開発

不正解の理由

  • B: Composer は柔軟だがルールがコード化されガバナンス標準化が困難です
  • C: スケジュールド クエリのみではルールの再利用や統合ダッシュボードが弱くなります
  • D: Dataflow は処理基盤であり品質チェック専用としてはオーバーエンジニアリングです

参考:Dataplex Data Quality の概要


コメント

コメント

コメントする

目次