AIF-C01#10(fundamentals-generative-ai)
ある企業が、大規模言語モデル(LLM)を基盤としたチャットボットを実装し、顧客サービス担当者にリアルタイムのコンテキスト応答を提供したいと考えています。同社は、会社のポリシーを知識ベースとして使用します。 この要件を最もコスト効率よく満たすソリューションはどれですか?
正解:C
正解の根拠
会社のポリシーをコンテキストとして応答に組み込みたい場合、検索拡張生成 (RAG) を実装するのが最もコスト効率の良い手法です。ポリシー文書を埋め込みベクトル化して Knowledge Base に格納し、クエリ時に関連箇所を検索して LLM に渡すことで、モデル再学習なしに最新ポリシーを反映できます。Bedrock Knowledge Bases で簡単に実現可能です。
知識付加の手法比較
| 手法 | コスト |
|---|---|
| RAG | 低 (推奨) |
| ファインチューニング | 中~高 |
| 再トレーニング | 超高 |
| プリトレーニング+拡張 | 超高 |
不正解の理由
- A: 再トレーニングは数百万ドル規模のコストがかかり、ポリシー反映用途として過剰です。
- B: ファインチューニングは RAG より高コストで、ポリシー更新時の再学習負荷も発生します。
- D: プリトレーニング+データ拡張は最も高コストで、ポリシー反映の手段としては過大投資です。

コメント