AIF-C01#25(foundation-models)

AIF-C01#25(foundation-models)
ある企業が新しい生成AIチャットボットを構築しています。このチャットボットは、Amazon Bedrock の基盤モデル(FM)を使用して回答を生成します。テスト中に、企業はこのチャットボットがプロンプトインジェクション攻撃(prompt injection attacks)を受けやすいことに気づきました。 最も少ない実装労力(LEAST implementation effort)で、チャットボットを保護するために企業ができることは何ですか?

正解:B

正解の根拠

Amazon Bedrock Guardrails はマネージドの安全制御機能で、コンテンツフィルタ (有害カテゴリのブロック)、拒否されたトピック、PII マスキング、プロンプトインジェクション検知などをポリシーとして適用できます。FM の再訓練やプロンプト書き換え不要で、最小実装でインジェクション攻撃から保護できる選択肢です。

セキュリティ対策の比較

対策労力
Bedrock Guardrails低 (設定のみ)
ファインチューニング高 (データ/学習)
モデル変更中 (互換検証)
CoT プロンプト本質対策にならず

不正解の理由

  • A: 有害応答抑止のためのファインチューニングは訓練データ準備とジョブ運用が必要で、最小実装の要件には合いません。
  • C: より安全な FM への変更も検証や移行コストが発生し、Guardrails の宣言的設定よりも実装負荷が大きくなります。
  • D: Chain-of-Thought は推論手順を分解する手法で、プロンプトインジェクション攻撃そのものを防御する仕組みではありません。

参考:Amazon Bedrock Guardrails


コメント

コメント

コメントする

目次