AIF-C01#58(fundamentals-generative-ai)
ある企業がチャットボットを作成しています。このチャットボットは Amazon Lex と Amazon OpenSearch Service を使用しており、企業のプライベートデータを使用して質問に回答します。同社は、データをデータベースに保存する前に、データをベクトル表現(vector representation)に変換する必要があります。 この要件を満たす基盤モデル(FM)のタイプはどれですか?
正解:C
正解の根拠
テキスト埋め込みモデル (Text Embeddings Model) はテキストを高次元ベクトル空間にマッピングし、意味的類似性を数値で扱えるようにするモデルです。Amazon Titan Embeddings や Cohere Embed が代表例で、OpenSearch のベクトル検索や RAG におけるベクトル DB 投入前の変換処理に必須です。Lex のチャットボットからの問合せ文と社内ドキュメントを同じベクトル空間に置き、類似度検索で関連回答を取得できます。
主要 FM タイプの比較
| モデルタイプ | 用途 |
|---|---|
| Embeddings | ベクトル化と類似度検索 |
| Text Completion | 続きの文章生成 |
| Instruction Following | 指示遂行 (Q&A 等) |
| Image Generation | 画像生成 (拡散モデル) |
不正解の理由
- A: テキスト補完モデルは続きを生成する用途で、ベクトル化処理を提供しません。
- B: 指示追従モデルは Q&A や要約に強いですが、ベクトル DB 用の埋め込み生成は別系統です。
- D: 画像生成モデルは Stable Diffusion 系で画像出力に特化しており、テキストのベクトル化用途とは異なります。

コメント