AIF-C01#50(foundation-models)

ある企業が、特定のドメイン（専門領域）に関する質問に回答できるよう、基盤モデル（FM）をファインチューニングしたいと考えています。この企業は「指示ベースのファインチューニング（instruction-based fine-tuning）」を使用する予定です。企業はトレーニングデータをどのように準備すべきですか？

A. 社内文書や業界固有の資料を収集する。それらの文書や資料を単一のファイルに統合する。
B. さまざまなオンラインソースから外部の企業レビューを収集する。各レビューにポジティブまたはネガティブのラベルを手動で付ける。
C. 企業の業界ドメインに関連するトピックに特化した、質問と回答のペアを作成する。
D. ドメイン知識のみに回答するようモデルに指示する「フューショットプロンプト（few-shot prompts）」を作成する。

正解と解説ディスカッション 0

正解：C

正解の根拠

指示ベースのファインチューニング (instruction-based fine-tuning) では、モデルに「指示と理想的な応答のペア」を学習させます。具体的には prompt と completion を JSONL 形式で用意し、Bedrock や SageMaker JumpStart のチューニングジョブに投入します。本問のドメイン QA 用途では、業界トピックに関する質問と模範回答ペアを作成するのが適切です。

データ準備手法の比較

手法	用途
指示+応答ペア	指示ベース FT
ラベル付き分類	分類タスク FT
テキストコーパス	継続的事前学習
Few-shot	プロンプト内例示のみ

不正解の理由

A: 文書を統合するだけでは指示と応答の対応がなく、指示ベース FT の入力フォーマットを満たさないため学習に使えません。
B: 感情ラベル付きレビューは感情分類向けデータセットで、ドメイン QA を学ばせる指示ベース FT のデータとしては不適切です。
D: Few-shot はプロンプト内に例示するランタイム手法で、ファインチューニング用のトレーニングデータ準備とは別概念です。

参考：Bedrock 指示 FT

AIF-C01#50(foundation-models)

正解の根拠

データ準備手法の比較

不正解の理由

コメント

コメント

コメントするコメントをキャンセル

正解の根拠

データ準備手法の比較

不正解の理由

コメント

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル