PMLE#2(data-collaboration)

PMLE#2(data-collaboration)

住宅価格予測モデルで「築年数」の値が 0 から 120 まで、「面積平方メートル」が 20 から 500 まで分布しています。勾配ベースの線形モデルで学習する前に推奨される前処理はどれですか。

ディスカッション 0

正解:C

正解の根拠

勾配ベースの最適化では特徴量のスケールが揃っていないと収束が遅くなり、影響度の大きい特徴量に偏ります。標準化または Min-Max により等スケールにそろえます。

手法用途
標準化正規分布を仮定する線形モデル
Min-Max距離ベースやニューラルネット

不正解の理由

  • B は連続値をカテゴリ化して情報を失います
  • C は本質的なスケール差を解消しません
  • D のラベルエンコーディングは連続値に不適切です

参考:Normalization


コメント

コメント

コメントする

目次