MLS-C01#2(modeling)
あるオンライン書店が利用者と書籍の購入ログを基にレコメンドモデルを SageMaker AI で構築します。ユーザー ID と書籍 ID は数百万規模で疎な行列を形成し、明示的な評価値はなく購入有無のみが分かります。協調フィルタリングに近い形で潜在因子を学習する組み込みアルゴリズムを採用したいと考えています。最も適切な選択肢はどれですか。
正解:B
正解の根拠
Factorization Machines は高次元かつ疎な特徴量に強く、ユーザー × アイテムのワンホット表現から潜在因子を学習する協調フィルタリング向けアルゴリズムです。predictor_type=binary_classifier で購入有無のような二値ターゲットを扱えます。
| アルゴリズム | 疎行列対応 | 潜在因子 |
|---|---|---|
| Factorization Machines | 強い | あり |
| Linear Learner | 可だが交互作用なし | なし |
| RCF | 異常検知 | なし |
| k-NN | 距離計算が高コスト | なし |
不正解の理由
- A: Linear Learner は ID 同士の交互作用を学習できず、疎行列のレコメンドには不向きです。
- C: RCF は異常検知用で、ユーザーとアイテム間の嗜好を表現できず推薦の代用になりません。
- D: k-NN は数百万 ID 規模では距離計算コストが膨大で、実用的ではありません。

コメント