AIF-C01#21(foundation-models)
ある企業が、事前学習済みの大型言語モデル(LLM)を使用しています。その LLM は、特定のドメイン(専門分野)の知識を必要とする複数のタスクを実行しなければなりませんが、そのドメインにおけるいくつかの技術的なトピックに関する情報を持っていません。企業は、モデルを微調整(ファインチューニング)するために使用できるラベルなしデータ(unlabeled data)を持っています。 これらの要件を満たすファインチューニング手法はどれですか?
正解:C
正解の根拠
継続事前学習 (Continued Pre-training) はラベルなしのドメインテキストを既存 LLM に追加学習させ、新たな専門知識を獲得させる手法です。本問のように特定ドメインの知識不足を補うラベルなしデータが手元にあるケースに最適で、Bedrock のカスタムモデル機能で実施できます。教師ありデータが不要な点が大きな利点です。
知識補完手法の比較
| 手法 | 必要データ |
|---|---|
| Continued Pre-training | ラベルなしテキスト |
| Supervised Fine-tuning | ラベル付きペア |
| Full Training | 大規模データ、超高コスト |
| RAG | 外部知識源 (学習不要) |
不正解の理由
- A: フルトレーニングは膨大なデータと計算リソースが必要で、ラベルなしデータでドメイン補強を行う本問の現実解ではありません。
- B: 教師ありファインチューニングはラベル付き入出力ペアを必須とし、ラベルなしデータしかない状況には適用できません。
- D: RAG は学習せず外部知識源を検索する手法で、データを使ってモデルを「ファインチューニング」する本問の要件と異なります。

コメント