Question#45(AI-102)

Azure サブスクリプションと 10,000 個の ASCII ファイルがあります。特定のフレーズを含むファイルを特定する必要があります。ソリューションはコサイン類似度（cosine similarity）を使用する必要があります。どの Azure OpenAI モデルを使用すべきですか？

A. text-embedding-ada-002
B. GPT-4
C. GPT-35 Turbo
D. GPT-4-32k

正解と解説ディスカッション 0

正解：A

「コサイン類似度」を使って「意味的な近さ」を計算するためには、テキストを数値のベクトルに変換する必要があります。 1. text-embedding-ada-002 (A) が最適な理由ベクトルの生成: このモデルは Embeddings（埋め込み）モデルであり、テキストを入力するとその意味を代表する数値ベクトルを出力します。類似性計算の前提: コサイン類似度は、2つの「ベクトル」の間の角度を計算する手法です。したがって、ベクトルを出力する Embeddings モデルが必須となります。効率: 10,000個ものファイルを処理する場合、GPT-4 などの生成モデルで一つずつ「このフレーズを含みますか？」と推論させるよりも、一度ベクトル化してベクトルデータベースで計算する方が、コスト・速度ともに圧倒的に有利です。

Question#45(AI-102)

コメント

コメント

コメントするコメントをキャンセル

コメント

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル