Question#52(AI-900)
機械学習のプロセスにおいて、トレーニングと評価のためにデータをどのように分割すべきですか?
正解:B
これは機械学習における標準的なデータ分割方法です。データセットをランダムに行単位で分割することで、トレーニングデータと評価データが同じ分布を持ち、モデルがトレーニングデータで学習したパターンを評価データで適切に検証できます。一般的な分割比率は、例えば70:30や80:20(トレーニング:評価)です。この方法は、モデルの汎化性能を評価するのに適しています。 機械学習において、データをトレーニング用と評価用に分割する際は、データセット全体をランダムに行単位で分割するのが一般的です。これにより、モデルがトレーニングデータで学習し、評価データでその性能を検証することができます。通常、データセットは行(サンプル)ごとに特徴量(入力)とラベル(出力)を含んでおり、トレーニング用と評価用に分割する際も各行が両方(特徴量とラベル)を含む形で分割されます。この方法により、モデルが未知のデータに対する汎化性能を適切に評価できます。
コメント