MLS-C01#5(modeling)

MLS-C01#5(modeling)

ある研究機関は数百万件のニュース記事から類似記事を高速に検索したいと考えています。各記事を 100 次元の埋め込みベクトルに変換した後、組み込みアルゴリズムで距離ベースの分類・最近傍検索を行いたいです。SageMaker AI 組み込みアルゴリズムとして最も適切な選択肢はどれですか。

ディスカッション 0

正解:C

正解の根拠

SageMaker AI の k-NN は埋め込みベクトルなど数値特徴に対する分類・回帰・最近傍検索に対応し、predictor_type や距離指標 (L2 / コサイン) を選べます。記事埋め込みからの近傍検索ユースケースに直接適合します。

項目k-NNLinear Learner
距離ベース検索得意非対象
非線形決定境界柔軟線形のみ
埋め込み入力そのまま利用線形結合のみ

不正解の理由

  • A: BlazingText の再学習だけでは検索基盤にならず、距離ベース推論の枠組みは別途必要です。
  • B: Linear Learner は線形決定境界で、近傍検索ではなく分類タスク用に設計されています。
  • D: RCF は異常検知用で、類似記事検索や多クラス分類の目的とは整合しません。

参考:SageMaker k-NN


コメント

コメント

コメントする

目次