AIF-C01#35(fundamentals-ai-ml)
ある企業が、センサーデータ内の異常なパターン(abnormal patterns)を検出するためのMLモデルを構築したいと考えています。しかし、この企業はトレーニング用のラベル付きデータ(labeled data)を持っていません。 これらの要件を満たすML手法はどれですか?
正解:D
正解の根拠
オートエンコーダーはニューラルネットワークによる教師なし学習手法で、入力を圧縮表現にエンコードし元に戻すデコードを学習します。再構成誤差が大きい入力を異常とみなせるため、ラベル付きデータがないセンサー異常検知に最適です。SageMaker の組込み Random Cut Forest や Lookout for Equipment と並び、AWS でも代表的な異常検知アプローチとして利用されます。
ML 手法の比較
| 手法 | 特徴 |
|---|---|
| オートエンコーダー | 教師なし、再構成誤差で異常検知 |
| 線形回帰 | 連続値予測、教師あり |
| 分類 | 離散ラベル予測、教師あり |
| 決定木 | 分類/回帰、教師あり |
不正解の理由
- A: 線形回帰は連続値を予測する教師あり手法で、ラベルなしの異常検出には適合しません。
- B: 分類はクラスラベル付きデータが必要な教師あり学習で、ラベルが存在しない本要件では使えません。
- C: 決定木も基本的に教師あり手法で、目的変数のラベルが必要なため要件を満たしません。

コメント