AIF-C01#69(fundamentals-generative-ai)

検索拡張生成（Retrieval Augmented Generation: RAG）における「チャンキング（chunking）」の目的は何ですか？

A. テキストの一部または塊（チャンク）を保存することで、大きなテキストドキュメントに対するデータベースのストレージ制限を回避するため
B. 大きなテキストをベクトル埋め込みに変換する必要性をなくし、効率を向上させるため
C. ベクトルインデックスから取得される結果のコンテキストの関連性（文脈的な関連性）を向上させるため
D. テキストの一部または塊を保存することで、ストレージのコストを削減するため

正解：C

正解の根拠

チャンキングは長文を意味的にまとまった小さな単位に分割し、それぞれをベクトル化して保存する RAG の前処理工程です。適切なチャンクサイズ (例 200〜500 トークン) を選ぶことで、検索時に余計なノイズが減り、関連性の高い文脈のみを LLM に渡せます。結果として取得結果のコンテキスト関連性と回答品質が向上します。

チャンキング戦略

戦略	特徴
固定長チャンク	シンプルで高速
意味境界分割	段落・見出し単位で精度向上
オーバーラップ	境界文脈の保持
階層チャンク	粗粒/細粒の二段検索

不正解の理由

A: ストレージ制限回避はチャンキングの主目的ではなく、関連性向上が本来の目的です。
B: チャンク化後も各チャンクは埋め込みベクトルに変換されるため、変換不要にはなりません。
D: コスト削減は副次効果に過ぎず、Bedrock Knowledge Bases 等の設計目的は文脈関連性の最適化です。

参考：Bedrock KB Chunking

AIF-C01#69(fundamentals-generative-ai)

正解の根拠

チャンキング戦略

不正解の理由

コメント

コメント

コメントするコメントをキャンセル

正解の根拠

チャンキング戦略

不正解の理由

コメント

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル