PDE#2(maintaining)
金融サービス企業が複数の BigQuery データセットに対して、データ品質ルール(NOT NULL、範囲チェック、参照整合性)を統一的に適用したいと考えています。ルール定義は YAML で管理し、毎日スキャン結果をダッシュボードで確認、違反時には監査ログに記録する必要があります。最適なソリューションはどれですか?
正解:A
正解の根拠
Dataplex Data Quality は YAML 形式でルールを宣言し、BigQuery テーブルに対してマネージドなスキャンを実行するサービスです。結果は自動的に BigQuery と Cloud Logging に出力され、Looker Studio ダッシュボードに統合可能です。違反時は Cloud Monitoring アラートと連携できるため、宣言的かつ運用負荷の低い品質管理が実現します。
サービス比較
| 項目 | Dataplex DQ | Composer 自作 |
|---|---|---|
| ルール定義 | 宣言的 YAML | Python コード |
| 結果保存 | 自動 BQ 出力 | 独自実装 |
| 監査ログ | 標準連携 | 追加開発 |
不正解の理由
- B: Composer は柔軟だがルールがコード化されガバナンス標準化が困難です
- C: スケジュールド クエリのみではルールの再利用や統合ダッシュボードが弱くなります
- D: Dataflow は処理基盤であり品質チェック専用としてはオーバーエンジニアリングです

コメント