AIF-C01#11(fundamentals-generative-ai)

AIF-C01#11(fundamentals-generative-ai)
ある企業が、Amazon Bedrock と Stable Diffusion を使用して、テキスト記述に基づく製品画像を生成する検索拡張生成(RAG)を利用しています。しかし、結果はランダムで具体的な詳細に欠けています。同社は生成される画像の具体性を向上させたいと考えています。 この要件を満たすソリューションはどれですか?

正解:C

正解の根拠

Classifier-Free Guidance (CFG) スケールは、Stable Diffusion 系の拡散モデルで「プロンプトへの忠実度」を制御するパラメータです。CFG を上げるほどモデルはプロンプトのテキスト記述に強く従い、具体的な詳細を反映した画像を生成します。低すぎるとランダムな結果になり、本問のような具体性向上ニーズに直接効く設定値です。

画像生成パラメータ

パラメータ効果
CFG スケールプロンプト忠実度
Stepsノイズ除去回数
Seed再現性制御
Mask編集領域指定

不正解の理由

  • A: 生成ステップ数増加は品質向上に効きますが、プロンプトへの忠実度を直接高める設定ではありません。
  • B: MASK_IMAGE_BLACK は inpainting のマスク指定で、テキスト記述の具体性反映には作用しません。
  • D: Stable Diffusion に「プロンプト強度」という独立パラメータはなく、CFG が該当機能です。

参考:Stable Diffusion Parameters


コメント

コメント

コメントする

目次