Question#42(AI-102)
Azure サブスクリプションを持っています。
ドキュメントを比較して意味的な類似性を判定するアプリを構築する必要があります。ソリューションは以下の要件を満たす必要があります。 各ドキュメントのトークンを表す数値ベクトル(numeric vectors)を返すこと。 開発工数を最小限に抑えること。 どの Azure OpenAI モデルを使用すべきですか?
正解:C
文章の「意味」をコンピューターが計算可能な数値の列に変換する技術を Embeddings(埋め込み) と呼びます。 1. embeddings (C) が最適な理由 数値ベクトルの生成: Embeddings モデル(例:text-embedding-3-small など)は、テキストを入力すると、その意味的な特徴を凝縮した高次元の数値ベクトルを出力します。 類似性計算: 2つの文章から得られたベクトル同士の「距離(コサイン類似度など)」を計算することで、言葉が違っても意味が似ているかどうかを判定できます。 開発工数の最小化: 自分で複雑な自然言語処理アルゴリズムを組む必要がなく、API にテキストを投げるだけでベクトルが手に入るため、工数を最小限に抑えられます。
コメント