AIF-C01#72(fundamentals-generative-ai)
企業が生成 AI アプリケーションに Amazon Bedrock を使用しています。企業は Amazon Bedrock Guardrails を使用して有害なユーザー入力とモデル生成出力を検出およびフィルタリングしたいと考えています。Guardrails がフィルタリングできるコンテンツカテゴリはどれですか?(2つ選択)
(2つ選択)
正解:A, C
正解の根拠
Amazon Bedrock Guardrails は、有害コンテンツを検出・フィルタリングする機能として複数のカテゴリを提供します。標準で Hate (ヘイト)、Insults (侮辱)、Sexual (性的)、Violence (暴力)、Misconduct (不正行為) などの有害カテゴリを定義しており、入力プロンプトとモデル出力の両方に対して閾値ベースでブロックや改変ができます。本問では Hate と Violence が公式に提供されるカテゴリです。
Guardrails の主要フィルタ
| 機能 | 内容 |
|---|---|
| Content filters | Hate/Insults/Sexual/Violence/Misconduct |
| Denied topics | 禁止トピック定義 |
| Word filters | 禁止語句 |
| PII filter | 個人情報のマスク |
不正解の理由
- B: 政治は標準カテゴリではなく、Denied topics でカスタム定義する必要があります。
- D: ギャンブルも標準ハーモニーカテゴリには含まれず、カスタム禁止トピック扱いです。
- E: 宗教も Content filters 標準カテゴリではなく、必要に応じて Denied topics で実装します。

コメント