MLS-C01#4(modeling)

MLS-C01#4(modeling)

あるクレジット会社は決済トランザクションを 1 秒あたり数千件処理しており、不正の疑いがある取引をリアルタイムに検出したいと考えています。ラベル付きの不正データはごく一部しかなく、大部分は正常取引です。教師なしで異常スコアを返す SageMaker AI 組み込みアルゴリズムとして最も適切なのはどれですか。

ディスカッション 0

正解:C

正解の根拠

Random Cut Forest (RCF) は教師なし異常検知の組み込みアルゴリズムで、各データ点に異常スコアを返します。num_trees でアンサンブルの安定性、num_samples_per_tree で各木が見るサブサンプルの多様性を制御します。

観点RCFk-means
異常スコア標準出力距離を間接利用
クラスタ前提不要必要
高次元耐性強い次元の呪いに弱い

不正解の理由

  • A: k-means は球状クラスタを仮定し、複雑な不正パターンの異常検知には適合度が低くなりがちです。
  • B: XGBoost は教師ありで、十分なラベル不正データが揃わない条件では精度が確保しにくいです。
  • D: Factorization Machines は推薦や疎な分類向けで、教師なし異常検知の用途とは合致しません。

参考:SageMaker Random Cut Forest


コメント

コメント

コメントする

目次