AI901-Concept#88
次の各設定目的に最も適した推論パラメータをドロップダウンから選択してください。同じ選択肢を 2 回以上使用できます。
| ステートメント | 選択 |
|---|---|
事実応答での出力ばらつきを抑え、同じ入力に対し近い応答を返す再現性を高めたい。 低 temperature (0〜0.3) は決定論的応答に近づけ、事実応答や再現性重視の場面で標準です。 | |
出力長の上限を制御し、過剰生成によるコスト膨張とレイテンシ悪化を防ぎたい。 max_tokens は生成上限を直接指定し、コスト予測とレスポンス時間制御の基本パラメータです。 | |
モデルの役割 / 出力形式 / 拒否ルールをアプリ意図に従って明示し、Responsible AI ガードレールも兼ねたい。 system message は LLM の振る舞いを規定するメタ プロンプトで、役割 / 制約 / ガードレールの基盤となります。 |
解説
【正解マッチング】
| 判定対象 | 正解 |
|---|---|
| 事実応答での出力ばらつきを抑え、同じ入力に対し近い応答を返す再現性を高めたい。 | temperature |
| 出力長の上限を制御し、過剰生成によるコスト膨張とレイテンシ悪化を防ぎたい。 | max_tokens |
| モデルの役割 / 出力形式 / 拒否ルールをアプリ意図に従って明示し、Responsible AI ガードレールも兼ねたい。 | system message |
【各判定の詳細】
- 「事実応答での出力ばらつきを抑え、同じ入力に対し近い応答を返す再現性を高めたい。」→ temperature: 低 temperature (0〜0.3) は決定論的応答に近づけ、事実応答や再現性重視の場面で標準です。
- 「出力長の上限を制御し、過剰生成によるコスト膨張とレイテンシ悪化を防ぎたい。」→ max_tokens: max_tokens は生成上限を直接指定し、コスト予測とレスポンス時間制御の基本パラメータです。
- 「モデルの役割 / 出力形式 / 拒否ルールをアプリ意図に従って明示し、Responsible A…」→ system message: system message は LLM の振る舞いを規定するメタ プロンプトで、役割 / 制約 / ガードレールの基盤となります。

コメント