AIF-C01#16(security-governance)
ある AI プラクティショナーが、機密データを含むトレーニングデータセットを使用して、Amazon Bedrock 上でカスタムモデルをトレーニングしました。AI プラクティショナーは、推論時にカスタムモデルが機密情報に基づいた応答を生成しないようにしたいと考えています。 どの対策を実施すべきでしょうか?
正解:A
正解の根拠
Bedrock のカスタムモデルは訓練時に与えたデータの特徴をパラメータに学習するため、推論応答が学習した機密情報を再現する可能性があります。本質的な解決には、機密データを除去したクリーンなデータセットでモデルを再トレーニングする必要があります。マスキングや暗号化はモデル内部の知識を消す手段ではなく、応答生成自体の抑止には機能しません。
機密データ漏えい対策の比較
| 対策 | 効果 |
|---|---|
| データ除去後の再訓練 | 根本的な漏えい防止 |
| 動的マスキング | 事後の置換のみ (限界) |
| SageMaker 暗号化 | 通信・保存時の保護 |
| KMS 暗号化 | アーティファクト保護 |
不正解の理由
- B: 動的マスキングは出力テキストの事後加工であり、モデルが内部に記憶した機密情報の生成自体は防止できません。
- C: SageMaker による暗号化は通信や保存データの保護目的で、推論文章の機密情報生成抑止には寄与しません。
- D: KMS は鍵管理によるアーティファクト保護を担いますが、推論結果に含まれる機密文の生成自体は止められません。

コメント