AIF-C01#31(foundation-models)
ある企業が生成AIツールを構築しています。この企業は、社内ドキュメントを使用して基盤モデル(FM)をカスタマイズしたいと考えています。 この要件を満たすアプローチはどれですか?
正解:B
正解の根拠
継続的事前学習 (Continued Pre-training) はラベルなしの社内ドキュメントを使い、既存 FM にドメイン知識を追加学習させるカスタマイズ手法です。Bedrock のカスタムモデル機能で実施でき、社内固有の用語、文体、業務知識を取り込むためにラベル付け不要なテキストデータがあるシナリオに最適な選択です。
カスタマイズ手法の比較
| 手法 | 用途 |
|---|---|
| Continued Pre-training | ドメイン知識補完 (ラベルなし) |
| Classification | 分類タスク (古典 ML) |
| Distillation | 大規模→小規模モデル化 |
| Regression | 連続値予測 (古典 ML) |
不正解の理由
- A: 分類は教師あり ML タスクの一種で、社内ドキュメントを FM に取り込んでカスタマイズする手法そのものではありません。
- C: 蒸留は大規模モデルから小規模モデルへ知識を移転する圧縮技術で、ドメインデータを取り込むカスタマイズ用途とは目的が異なります。
- D: 回帰は連続値を予測する古典 ML 手法で、ラベルなしテキストで FM をドメイン適応させる手段としては該当しません。

コメント