MLS-C01#4(modeling)
あるクレジット会社は決済トランザクションを 1 秒あたり数千件処理しており、不正の疑いがある取引をリアルタイムに検出したいと考えています。ラベル付きの不正データはごく一部しかなく、大部分は正常取引です。教師なしで異常スコアを返す SageMaker AI 組み込みアルゴリズムとして最も適切なのはどれですか。
正解:C
正解の根拠
Random Cut Forest (RCF) は教師なし異常検知の組み込みアルゴリズムで、各データ点に異常スコアを返します。num_trees でアンサンブルの安定性、num_samples_per_tree で各木が見るサブサンプルの多様性を制御します。
| 観点 | RCF | k-means |
|---|---|---|
| 異常スコア | 標準出力 | 距離を間接利用 |
| クラスタ前提 | 不要 | 必要 |
| 高次元耐性 | 強い | 次元の呪いに弱い |
不正解の理由
- A: k-means は球状クラスタを仮定し、複雑な不正パターンの異常検知には適合度が低くなりがちです。
- B: XGBoost は教師ありで、十分なラベル不正データが揃わない条件では精度が確保しにくいです。
- D: Factorization Machines は推薦や疎な分類向けで、教師なし異常検知の用途とは合致しません。

コメント