PMLE#4(data-collaboration)
時系列の株価データでモデルを学習し未来を予測したいと考えます。データを訓練・検証・テストに分割する正しい方法はどれですか。
正解:D
正解の根拠
時系列予測では情報の漏れを防ぐため時間に基づく分割を行い、未来のデータが訓練に混入しないようにします。
| 分割 | 期間 |
|---|---|
| train | 過去 |
| validation | 中間 |
| test | 最新 |
不正解の理由
- B は未来情報が訓練に漏れリーク発生します
- C は時系列の順序を無視します
- D は予測の方向と矛盾します

コメント