AIF-C01#66(fundamentals-generative-ai)

大規模言語モデル（LLM）における「ベクトル埋め込み（vector embeddings）」の目的は何ですか？

A. テキストを管理可能なデータの断片に分割すること。
B. 一連の文字を1つの単位として扱うためにグループ化すること。
C. テキストを数学的に比較する能力を提供すること。
D. 入力に含まれるすべての単語のカウント（出現回数）を提供すること。

正解：C

正解の根拠

ベクトル埋め込みは語句や文を高次元の数値ベクトルに変換し、コサイン類似度や内積などの数学的演算で意味の近さを比較できるようにする仕組みです。これにより RAG での類似ドキュメント検索、クラスタリング、分類など多様な NLP タスクが可能となります。Titan Embeddings や Cohere Embed、OpenSearch ベクトル検索が代表的な実装基盤です。

NLP 前処理ステップの比較

処理	役割
Embedding	意味をベクトル化し数学的比較
Chunking	長文を扱いやすい単位に分割
Tokenization	テキストをトークンに分解
BoW	単語出現回数のカウント

不正解の理由

A: テキスト分割はチャンキングの役割で、埋め込みはチャンク後のベクトル化に該当します。
B: 文字列のグループ化はトークン化の説明で、埋め込みの主目的とは異なります。
D: 単語カウントは Bag-of-Words 等の単純な統計表現で、意味の数値表現を提供する埋め込みとは別概念です。

参考：Titan Embeddings

AIF-C01#66(fundamentals-generative-ai)

正解の根拠

NLP 前処理ステップの比較

不正解の理由

コメント

コメント

コメントするコメントをキャンセル

正解の根拠

NLP 前処理ステップの比較

不正解の理由

コメント

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル