AIF-C01#72(fundamentals-generative-ai)

AIF-C01#72(fundamentals-generative-ai)
企業が生成 AI アプリケーションに Amazon Bedrock を使用しています。企業は Amazon Bedrock Guardrails を使用して有害なユーザー入力とモデル生成出力を検出およびフィルタリングしたいと考えています。Guardrails がフィルタリングできるコンテンツカテゴリはどれですか?(2つ選択)

(2つ選択)

正解:A, C

正解の根拠

Amazon Bedrock Guardrails は、有害コンテンツを検出・フィルタリングする機能として複数のカテゴリを提供します。標準で Hate (ヘイト)、Insults (侮辱)、Sexual (性的)、Violence (暴力)、Misconduct (不正行為) などの有害カテゴリを定義しており、入力プロンプトとモデル出力の両方に対して閾値ベースでブロックや改変ができます。本問では Hate と Violence が公式に提供されるカテゴリです。

Guardrails の主要フィルタ

機能内容
Content filtersHate/Insults/Sexual/Violence/Misconduct
Denied topics禁止トピック定義
Word filters禁止語句
PII filter個人情報のマスク

不正解の理由

  • B: 政治は標準カテゴリではなく、Denied topics でカスタム定義する必要があります。
  • D: ギャンブルも標準ハーモニーカテゴリには含まれず、カスタム禁止トピック扱いです。
  • E: 宗教も Content filters 標準カテゴリではなく、必要に応じて Denied topics で実装します。

参考:Guardrails Content Filters


コメント

コメント

コメントする

目次