AIF-C01#17(fundamentals-generative-ai)
AIや自然言語処理(NLP)モデルが、テキスト情報の理解を向上させるために使用する現実世界のオブジェクトや概念の数値表現を指す用語はどれですか?
正解:B
正解の根拠
埋め込み (Embeddings) は単語、文、画像、エンティティなどを高次元のベクトル空間に写像した数値表現で、意味的類似性を距離計算で測定できます。Word2Vec、BERT、Titan Embeddings などのモデルが生成し、RAG のベクトル検索や推薦、クラスタリングで広く活用される NLP/AI の基礎概念です。
関連用語の整理
| 用語 | 意味 |
|---|---|
| Embeddings | 意味の数値ベクトル表現 |
| Token | テキストの最小処理単位 |
| Model | 学習済みアルゴリズム |
| Binary | 2 値表現 |
不正解の理由
- A: モデルは学習済みアルゴリズム全体を指す広義概念で、数値表現そのものの用語ではありません。
- C: トークンは ID 化された処理単位で、意味的距離を保つベクトル表現とは異なる概念です。
- D: バイナリは 2 値データを指し、意味的近さを保持する高次元埋め込みとは別物です。

コメント