AIF-C01#51(fundamentals-generative-ai)
ある企業が、アプリケーションに新機能を導入しようとしています。その機能は、出力メッセージのスタイルを洗練させる(リファインする)ものです。企業はこの機能を実装するために、Amazon Bedrock上の大規模言語モデル(LLM)をファインチューニングする予定です。 この要件を満たすために、企業はどのような種類のデータを必要としますか?
正解:C
正解の根拠
ファインチューニングでは「入力 (元のメッセージ) と望ましい出力 (洗練後のメッセージ)」のペアからなる教師ありデータセットが必要です。Bedrock のカスタマイズ機能では JSONL 形式で prompt/completion ペアを与え、モデルがマッピング関係を学習することで、本番でも入力に対し期待スタイルの出力を生成できるようになります。
カスタマイズ手法とデータ
| 手法 | 必要データ |
|---|---|
| Fine-tuning | 入出力ペア (教師あり) |
| 継続事前学習 | 大量の生コーパス |
| RAG | 知識ドキュメント |
| Few-shot | プロンプト内例示 |
不正解の理由
- A: 入力のみのサンプルでは正解信号が無く、教師あり学習であるファインチューニングでは学習が成立しません。
- B: 出力のみでは入力との対応が取れず、入力→望ましい出力という写像をモデルが学習できません。
- D: 独立な入力と出力を別々に与えても対応関係が示せず、ファインチューニングのペアデータ要件を満たしません。

コメント