AIF-C01#11(fundamentals-generative-ai)
ある企業が、Amazon Bedrock と Stable Diffusion を使用して、テキスト記述に基づく製品画像を生成する検索拡張生成(RAG)を利用しています。しかし、結果はランダムで具体的な詳細に欠けています。同社は生成される画像の具体性を向上させたいと考えています。 この要件を満たすソリューションはどれですか?
正解:C
正解の根拠
Classifier-Free Guidance (CFG) スケールは、Stable Diffusion 系の拡散モデルで「プロンプトへの忠実度」を制御するパラメータです。CFG を上げるほどモデルはプロンプトのテキスト記述に強く従い、具体的な詳細を反映した画像を生成します。低すぎるとランダムな結果になり、本問のような具体性向上ニーズに直接効く設定値です。
画像生成パラメータ
| パラメータ | 効果 |
|---|---|
| CFG スケール | プロンプト忠実度 |
| Steps | ノイズ除去回数 |
| Seed | 再現性制御 |
| Mask | 編集領域指定 |
不正解の理由
- A: 生成ステップ数増加は品質向上に効きますが、プロンプトへの忠実度を直接高める設定ではありません。
- B: MASK_IMAGE_BLACK は inpainting のマスク指定で、テキスト記述の具体性反映には作用しません。
- D: Stable Diffusion に「プロンプト強度」という独立パラメータはなく、CFG が該当機能です。

コメント