AIF-C01#8(fundamentals-ai-ml)
ある企業が顧客離脱(churn)を予測するための機械学習モデルを開発しています。このモデルはトレーニングデータでは良好に動作しますが、新しいデータに対して正確に予測できません。 この問題を解決するソリューションはどれですか?
正解:B
正解の根拠
訓練データに高精度で適合する一方で新しいデータに対する予測精度が低い状態は過学習です。正則化パラメータ (L1/L2 など) を強くすると重みのノルムにペナルティが課され、モデルの複雑さが抑制され汎化性能が改善します。SageMaker の組込みアルゴリズムや Autopilot でも正則化強度の調整は標準的な対策です。
過学習対策の比較
| 手法 | 効果 |
|---|---|
| 正則化を強める | 複雑度を抑え汎化向上 |
| 特徴量増加 | むしろ過学習悪化 |
| エポック増加 | 過学習悪化リスク |
| 正則化弱める | 過学習悪化 |
不正解の理由
- A: 正則化を弱めるとモデル複雑度が増し、過学習を逆に悪化させるため要件と正反対です。
- C: 特徴量を追加すると次元の呪いやノイズ増で過学習が悪化しやすく、根本対策にはなりません。
- D: エポック数を増やすと訓練データへの適合がさらに進み、過学習が深刻化する典型ケースです。

コメント