Question#3(MLS-C01)

Question#3(MLS-C01)

ある化学会社は、化学プロセスの異常を特定するために複数の機械学習(ML)ソリューションを開発しました。過去2年間の独立変数の時系列値とラベルが利用可能であり、問題を正確にモデル化するのに十分です。通常の運用ラベルは0、異常運用ラベルは1とマークされています。プロセスの異常は、会社の利益に重大な悪影響を及ぼします。会社はこれらの異常を回避する必要があります。どのメトリクスが、異常を検出する最大の確率を提供するMLソリューションを示しますか?

ディスカッション 0

正解:B

このシナリオの核心は「異常検出に失敗すると大きな損失を招く」という点です。つまり、多少の誤検知(False Positive)があっても、異常を見逃さないことが重要です。

そのため、再現率(Recall, 真の異常のうち正しく異常と予測できた割合) を最大化することが最も重要な評価基準となります。再現率が高ければ、異常を見逃す確率(False Negative)が小さくなり、会社の利益を守ることができます。 選択肢を比較すると、
  • 1(Recall=0.6) は適合率は高いですが、異常を40%も見逃すため不適切です。
  • 2(Recall=0.98) は適合率は低めですが、異常をほとんど見逃さないため、このシナリオに最も適しています。
  • 3(Recall=0.9) は妥当ですが、Recall=0.98のBに劣ります。
  • 4(Recall=0.8) は適合率が高く一見よさそうですが、異常を20%見逃してしまうため不十分です。
したがって、異常検知を最優先する本ケースでは 2 が正解です。

コメント

コメント

コメントする

目次