AIF-C01#51(fundamentals-generative-ai)

ある企業が、アプリケーションに新機能を導入しようとしています。その機能は、出力メッセージのスタイルを洗練させる（リファインする）ものです。企業はこの機能を実装するために、Amazon Bedrock上の大規模言語モデル（LLM）をファインチューニングする予定です。この要件を満たすために、企業はどのような種類のデータを必要としますか？

A. 入力メッセージのみのサンプル
B. 出力メッセージのみのサンプル
C. 入力メッセージと出力メッセージのペアのサンプル
D. 入力メッセージと出力メッセージそれぞれの、独立したサンプル

正解と解説ディスカッション 0

正解：C

正解の根拠

ファインチューニングでは「入力 (元のメッセージ) と望ましい出力 (洗練後のメッセージ)」のペアからなる教師ありデータセットが必要です。Bedrock のカスタマイズ機能では JSONL 形式で prompt/completion ペアを与え、モデルがマッピング関係を学習することで、本番でも入力に対し期待スタイルの出力を生成できるようになります。

カスタマイズ手法とデータ

手法	必要データ
Fine-tuning	入出力ペア (教師あり)
継続事前学習	大量の生コーパス
RAG	知識ドキュメント
Few-shot	プロンプト内例示

不正解の理由

A: 入力のみのサンプルでは正解信号が無く、教師あり学習であるファインチューニングでは学習が成立しません。
B: 出力のみでは入力との対応が取れず、入力→望ましい出力という写像をモデルが学習できません。
D: 独立な入力と出力を別々に与えても対応関係が示せず、ファインチューニングのペアデータ要件を満たしません。

参考：Bedrock Model Customization

AIF-C01#51(fundamentals-generative-ai)

正解の根拠

カスタマイズ手法とデータ

不正解の理由

コメント

コメント

コメントするコメントをキャンセル

正解の根拠

カスタマイズ手法とデータ

不正解の理由

コメント

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル