AIF-C01#6(fundamentals-generative-ai)
出版会社は、公開コンテンツと対話できる機能をユーザーに提供するために、Retrieval Augmented Generation (RAG) ベースのソリューションを構築しました。新しいコンテンツが毎日公開されます。企業はユーザーにほぼリアルタイムの体験を提供したいと考えています。これらの要件を満たすために、RAG パイプラインのどのステップをオフラインのバッチ処理で実装すべきですか?(2つ選択)
(2つ選択)
正解:A, C
正解の根拠
RAG パイプラインのうちコンテンツ埋め込み生成と検索インデックス作成は、データ追加時に一度実行すれば良いオフライン処理で、毎日のバッチで更新するのが効率的です。一方ユーザークエリ埋め込み、関連コンテンツ取得、応答生成はリアルタイムで実行する必要があります。新コンテンツを毎日 ingest し、検索処理は低レイテンシで返す構成が標準パターンです。
RAG パイプラインの実行タイミング
| ステップ | タイミング |
|---|---|
| コンテンツ埋め込み生成 | オフライン (バッチ) |
| 検索インデックス作成 | オフライン (バッチ) |
| クエリ埋め込み | オンライン |
| 取得・応答生成 | オンライン |
不正解の理由
- B: クエリ埋め込みはユーザー入力ごとに実行が必要で、リアルタイム処理であるべきです。
- D: 関連コンテンツの取得は低レイテンシで返却すべきオンライン処理です。
- E: 応答生成はリアルタイム体験の核で、バッチ化するとユーザー体験が損なわれます。

コメント