AIF-C01#69(fundamentals-generative-ai)
検索拡張生成(Retrieval Augmented Generation: RAG)における「チャンキング(chunking)」の目的は何ですか?
正解:C
正解の根拠
チャンキングは長文を意味的にまとまった小さな単位に分割し、それぞれをベクトル化して保存する RAG の前処理工程です。適切なチャンクサイズ (例 200〜500 トークン) を選ぶことで、検索時に余計なノイズが減り、関連性の高い文脈のみを LLM に渡せます。結果として取得結果のコンテキスト関連性と回答品質が向上します。
チャンキング戦略
| 戦略 | 特徴 |
|---|---|
| 固定長チャンク | シンプルで高速 |
| 意味境界分割 | 段落・見出し単位で精度向上 |
| オーバーラップ | 境界文脈の保持 |
| 階層チャンク | 粗粒/細粒の二段検索 |
不正解の理由
- A: ストレージ制限回避はチャンキングの主目的ではなく、関連性向上が本来の目的です。
- B: チャンク化後も各チャンクは埋め込みベクトルに変換されるため、変換不要にはなりません。
- D: コスト削減は副次効果に過ぎず、Bedrock Knowledge Bases 等の設計目的は文脈関連性の最適化です。

コメント