AIF-C01#21(foundation-models)

ある企業が、事前学習済みの大型言語モデル（LLM）を使用しています。その LLM は、特定のドメイン（専門分野）の知識を必要とする複数のタスクを実行しなければなりませんが、そのドメインにおけるいくつかの技術的なトピックに関する情報を持っていません。企業は、モデルを微調整（ファインチューニング）するために使用できるラベルなしデータ（unlabeled data）を持っています。これらの要件を満たすファインチューニング手法はどれですか？

A. フルトレーニング (Full training)
B. 教師ありファインチューニング (Supervised fine-tuning)
C. 継続事前学習 (Continued pre-training)
D. 検索拡張生成 (RAG: Retrieval Augmented Generation)

正解と解説ディスカッション 0

正解：C

正解の根拠

継続事前学習 (Continued Pre-training) はラベルなしのドメインテキストを既存 LLM に追加学習させ、新たな専門知識を獲得させる手法です。本問のように特定ドメインの知識不足を補うラベルなしデータが手元にあるケースに最適で、Bedrock のカスタムモデル機能で実施できます。教師ありデータが不要な点が大きな利点です。

知識補完手法の比較

手法	必要データ
Continued Pre-training	ラベルなしテキスト
Supervised Fine-tuning	ラベル付きペア
Full Training	大規模データ、超高コスト
RAG	外部知識源 (学習不要)

不正解の理由

A: フルトレーニングは膨大なデータと計算リソースが必要で、ラベルなしデータでドメイン補強を行う本問の現実解ではありません。
B: 教師ありファインチューニングはラベル付き入出力ペアを必須とし、ラベルなしデータしかない状況には適用できません。
D: RAG は学習せず外部知識源を検索する手法で、データを使ってモデルを「ファインチューニング」する本問の要件と異なります。

参考：Bedrock Continued Pre-training

AIF-C01#21(foundation-models)

正解の根拠

知識補完手法の比較

不正解の理由

コメント

コメント

コメントするコメントをキャンセル

正解の根拠

知識補完手法の比較

不正解の理由

コメント

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル