Question#3(MLS-C01)

ある化学会社は、化学プロセスの異常を特定するために複数の機械学習（ML）ソリューションを開発しました。過去2年間の独立変数の時系列値とラベルが利用可能であり、問題を正確にモデル化するのに十分です。通常の運用ラベルは0、異常運用ラベルは1とマークされています。プロセスの異常は、会社の利益に重大な悪影響を及ぼします。会社はこれらの異常を回避する必要があります。どのメトリクスが、異常を検出する最大の確率を提供するMLソリューションを示しますか？

A. 適合率（Precision）= 0.91、再現率（Recall）= 0.6
B. 適合率（Precision）= 0.61、再現率（Recall）= 0.98
C. 適合率（Precision）= 0.7、再現率（Recall）= 0.9
D. 適合率（Precision）= 0.98、再現率（Recall）= 0.8

正解と解説ディスカッション 0

正解：B

このシナリオの核心は「異常検出に失敗すると大きな損失を招く」という点です。つまり、多少の誤検知（False Positive）があっても、異常を見逃さないことが重要です。

そのため、再現率（Recall, 真の異常のうち正しく異常と予測できた割合） を最大化することが最も重要な評価基準となります。再現率が高ければ、異常を見逃す確率（False Negative）が小さくなり、会社の利益を守ることができます。選択肢を比較すると、

1（Recall=0.6） は適合率は高いですが、異常を40%も見逃すため不適切です。
2（Recall=0.98） は適合率は低めですが、異常をほとんど見逃さないため、このシナリオに最も適しています。
3（Recall=0.9） は妥当ですが、Recall=0.98のBに劣ります。
4（Recall=0.8） は適合率が高く一見よさそうですが、異常を20%見逃してしまうため不十分です。

したがって、異常検知を最優先する本ケースでは 2 が正解です。

Question#3(MLS-C01)

コメント

コメント

コメントするコメントをキャンセル

コメント

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル