AIF-C01#5(security-governance)
AI プラクティショナーが、機密データを含むトレーニングデータセットを使用して Amazon Bedrock でカスタムモデルをトレーニングしました。このプラクティショナーは、カスタムモデルが推論時に機密データに基づいた応答を生成しないようにしたいと考えています。
どのアクションを実行すべきですか?
正解:B
正解の根拠
Bedrock のカスタムモデルは訓練データの分布や特徴をパラメータに学習しているため、推論応答が学習時の機密情報を再現してしまう可能性があります。根本的に防止するには、トレーニングデータセットから機密データを除去したうえでモデルを再トレーニングすることが唯一の本質的対策です。マスキングや暗号化は出力後の事後対応であり、モデル内部に取り込まれた情報の漏えいを完全には防げません。
機密データ漏えい対策の比較
| 対策 | 効果 |
|---|---|
| データ除去後の再訓練 | 根本的な漏えい防止 |
| 動的データマスキング | 応答の事後マスク (限界あり) |
| SageMaker 暗号化 | 保存・通信の保護 |
| KMS 暗号化 | アーティファクト保護 |
不正解の理由
- A: 動的マスキングは応答テキストを事後に置換する手法で、モデルが内部に学習した機密情報の生成自体は防止できません。
- C: SageMaker による暗号化は通信や保存データの保護目的で、モデル出力に含まれる機密情報の生成抑止には寄与しません。
- D: KMS の暗号化は鍵管理によりアーティファクトを守りますが、推論で生成される文章中の機密情報を抑制しません。

コメント