Question#52(AI-900)

機械学習のプロセスにおいて、トレーニングと評価のためにデータをどのように分割すべきですか？

A. トレーニングには特徴量を使用し、評価にはラベルを使用する。
B. データをランダムに行単位でトレーニング用と評価用に分割する。
C. トレーニングにはラベルを使用し、評価には特徴量を使用する。
D. データをランダムに列単位でトレーニング用と評価用に分割する。

正解：B

これは機械学習における標準的なデータ分割方法です。データセットをランダムに行単位で分割することで、トレーニングデータと評価データが同じ分布を持ち、モデルがトレーニングデータで学習したパターンを評価データで適切に検証できます。一般的な分割比率は、例えば70:30や80:20（トレーニング:評価）です。この方法は、モデルの汎化性能を評価するのに適しています。機械学習において、データをトレーニング用と評価用に分割する際は、データセット全体をランダムに行単位で分割するのが一般的です。これにより、モデルがトレーニングデータで学習し、評価データでその性能を検証することができます。通常、データセットは行（サンプル）ごとに特徴量（入力）とラベル（出力）を含んでおり、トレーニング用と評価用に分割する際も各行が両方（特徴量とラベル）を含む形で分割されます。この方法により、モデルが未知のデータに対する汎化性能を適切に評価できます。

Question#52(AI-900)

コメント

コメント

コメントするコメントをキャンセル

コメント

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル