AIF-C01#31(fundamentals-ai-ml)

AIF-C01#31(fundamentals-ai-ml)
あるAI実務者が、トレーニングデータセットでモデルをトレーニングしました。そのモデルはトレーニングデータでは良好な性能(精度)を示しましたが、評価データ(テストデータ)では良好な性能を示しませんでした。 この問題の最も可能性の高い原因は何ですか?

正解:D

正解の根拠

訓練データでは高精度ながら評価データで性能が落ちる現象は、訓練データに過剰適合した過学習 (オーバーフィッティング) です。モデル容量過大、訓練データ不足、正則化不足が主因で、対策としては正則化強化、データ拡張、早期終了、ドロップアウトなどが取られます。SageMaker でも検証損失監視と組合せ可能です。

性能ギャップの典型診断

症状原因
train高/test低過学習
train低/test低未学習
群間差大バイアス
応答低品質プロンプト改善余地

不正解の理由

  • A: 未学習なら訓練データでも性能が低く、訓練データ高精度の状況とは矛盾します。
  • B: プロンプトエンジニアリングは LLM の応答制御に関する話で、教師あり学習の汎化性能ギャップ問題には直接該当しません。
  • C: バイアスはサブグループ間の予測差として現れる現象で、train/test 全体の性能ギャップを単独説明する原因ではありません。

参考:SageMaker Algorithms


コメント

コメント

コメントする

目次