MLS-C01#5(modeling)
ある研究機関は数百万件のニュース記事から類似記事を高速に検索したいと考えています。各記事を 100 次元の埋め込みベクトルに変換した後、組み込みアルゴリズムで距離ベースの分類・最近傍検索を行いたいです。SageMaker AI 組み込みアルゴリズムとして最も適切な選択肢はどれですか。
正解:C
正解の根拠
SageMaker AI の k-NN は埋め込みベクトルなど数値特徴に対する分類・回帰・最近傍検索に対応し、predictor_type や距離指標 (L2 / コサイン) を選べます。記事埋め込みからの近傍検索ユースケースに直接適合します。
| 項目 | k-NN | Linear Learner |
|---|---|---|
| 距離ベース検索 | 得意 | 非対象 |
| 非線形決定境界 | 柔軟 | 線形のみ |
| 埋め込み入力 | そのまま利用 | 線形結合のみ |
不正解の理由
- A: BlazingText の再学習だけでは検索基盤にならず、距離ベース推論の枠組みは別途必要です。
- B: Linear Learner は線形決定境界で、近傍検索ではなく分類タスク用に設計されています。
- D: RCF は異常検知用で、類似記事検索や多クラス分類の目的とは整合しません。

コメント