MLS-C01#2(modeling)

MLS-C01#2(modeling)

あるオンライン書店が利用者と書籍の購入ログを基にレコメンドモデルを SageMaker AI で構築します。ユーザー ID と書籍 ID は数百万規模で疎な行列を形成し、明示的な評価値はなく購入有無のみが分かります。協調フィルタリングに近い形で潜在因子を学習する組み込みアルゴリズムを採用したいと考えています。最も適切な選択肢はどれですか。

ディスカッション 0

正解:B

正解の根拠

Factorization Machines は高次元かつ疎な特徴量に強く、ユーザー × アイテムのワンホット表現から潜在因子を学習する協調フィルタリング向けアルゴリズムです。predictor_type=binary_classifier で購入有無のような二値ターゲットを扱えます。

アルゴリズム疎行列対応潜在因子
Factorization Machines強いあり
Linear Learner可だが交互作用なしなし
RCF異常検知なし
k-NN距離計算が高コストなし

不正解の理由

  • A: Linear Learner は ID 同士の交互作用を学習できず、疎行列のレコメンドには不向きです。
  • C: RCF は異常検知用で、ユーザーとアイテム間の嗜好を表現できず推薦の代用になりません。
  • D: k-NN は数百万 ID 規模では距離計算コストが膨大で、実用的ではありません。

参考:SageMaker Factorization Machines


コメント

コメント

コメントする

目次