AIF-C01#69(fundamentals-generative-ai)

AIF-C01#69(fundamentals-generative-ai)
検索拡張生成(Retrieval Augmented Generation: RAG)における「チャンキング(chunking)」の目的は何ですか?

正解:C

正解の根拠

チャンキングは長文を意味的にまとまった小さな単位に分割し、それぞれをベクトル化して保存する RAG の前処理工程です。適切なチャンクサイズ (例 200〜500 トークン) を選ぶことで、検索時に余計なノイズが減り、関連性の高い文脈のみを LLM に渡せます。結果として取得結果のコンテキスト関連性と回答品質が向上します。

チャンキング戦略

戦略特徴
固定長チャンクシンプルで高速
意味境界分割段落・見出し単位で精度向上
オーバーラップ境界文脈の保持
階層チャンク粗粒/細粒の二段検索

不正解の理由

  • A: ストレージ制限回避はチャンキングの主目的ではなく、関連性向上が本来の目的です。
  • B: チャンク化後も各チャンクは埋め込みベクトルに変換されるため、変換不要にはなりません。
  • D: コスト削減は副次効果に過ぎず、Bedrock Knowledge Bases 等の設計目的は文脈関連性の最適化です。

参考:Bedrock KB Chunking


コメント

コメント

コメントする

目次