AIF-C01#70(foundation-models)
ある企業が、Amazon Bedrock の基盤モデル(FM)を使用してAI検索ツールを構築しています。同社は、モデルの精度を向上させるために、自社データを使用してモデルをファインチューニングしたいと考えています。 モデルを正しくファインチューニングするための戦略はどれですか?
正解:A
正解の根拠
Bedrock のファインチューニングでは、prompt フィールドと completion フィールドを持つ JSONL 形式のラベル付きデータを S3 に配置し、対象モデル (Titan、Cohere、Llama など対応モデル) のチューニングジョブを実行します。プロンプトと望ましい出力のペアをきちんと整備することが精度向上の鍵です。
FT データの要件
| 要素 | 内容 |
|---|---|
| 形式 | JSONL (prompt/completion) |
| ストレージ | S3 バケット |
| 件数 | モデルごとに最小要件 |
| 品質 | 業務スタイルを反映 |
不正解の理由
- B: Bedrock の FT 入力フォーマットは JSONL であり、CSV 行を含む TXT ファイルは規定形式と異なるため受け付けられません。
- C: Provisioned Throughput はカスタムモデルを稼働させるための容量予約で、FT そのもののデータ準備手段ではありません。
- D: 学術誌や教科書のみで学習させても自社用途の入出力ペアにはならず、ファインチューニングの目的を達成できません。

コメント