AIF-C01#50(foundation-models)
ある企業が、特定のドメイン(専門領域)に関する質問に回答できるよう、基盤モデル(FM)をファインチューニングしたいと考えています。この企業は「指示ベースのファインチューニング(instruction-based fine-tuning)」を使用する予定です。 企業はトレーニングデータをどのように準備すべきですか?
正解:C
正解の根拠
指示ベースのファインチューニング (instruction-based fine-tuning) では、モデルに「指示と理想的な応答のペア」を学習させます。具体的には prompt と completion を JSONL 形式で用意し、Bedrock や SageMaker JumpStart のチューニングジョブに投入します。本問のドメイン QA 用途では、業界トピックに関する質問と模範回答ペアを作成するのが適切です。
データ準備手法の比較
| 手法 | 用途 |
|---|---|
| 指示+応答ペア | 指示ベース FT |
| ラベル付き分類 | 分類タスク FT |
| テキストコーパス | 継続的事前学習 |
| Few-shot | プロンプト内例示のみ |
不正解の理由
- A: 文書を統合するだけでは指示と応答の対応がなく、指示ベース FT の入力フォーマットを満たさないため学習に使えません。
- B: 感情ラベル付きレビューは感情分類向けデータセットで、ドメイン QA を学ばせる指示ベース FT のデータとしては不適切です。
- D: Few-shot はプロンプト内に例示するランタイム手法で、ファインチューニング用のトレーニングデータ準備とは別概念です。

コメント