PMLE#2(data-collaboration)
住宅価格予測モデルで「築年数」の値が 0 から 120 まで、「面積平方メートル」が 20 から 500 まで分布しています。勾配ベースの線形モデルで学習する前に推奨される前処理はどれですか。
正解:C
正解の根拠
勾配ベースの最適化では特徴量のスケールが揃っていないと収束が遅くなり、影響度の大きい特徴量に偏ります。標準化または Min-Max により等スケールにそろえます。
| 手法 | 用途 |
|---|---|
| 標準化 | 正規分布を仮定する線形モデル |
| Min-Max | 距離ベースやニューラルネット |
不正解の理由
- B は連続値をカテゴリ化して情報を失います
- C は本質的なスケール差を解消しません
- D のラベルエンコーディングは連続値に不適切です

コメント