PMLE#4(data-collaboration)

PMLE#4(data-collaboration)

時系列の株価データでモデルを学習し未来を予測したいと考えます。データを訓練・検証・テストに分割する正しい方法はどれですか。

ディスカッション 0

正解:D

正解の根拠

時系列予測では情報の漏れを防ぐため時間に基づく分割を行い、未来のデータが訓練に混入しないようにします。

分割期間
train過去
validation中間
test最新

不正解の理由

  • B は未来情報が訓練に漏れリーク発生します
  • C は時系列の順序を無視します
  • D は予測の方向と矛盾します

参考:Time-based split


コメント

コメント

コメントする

目次