Question#50(MLS-C01)
データサイエンティストは Amazon SageMaker Data Wrangler を使って、Amazon S3 からインポートしたデータセットの特徴量サマリーを取得しました。 その結果、ある特徴量の 予測力スコア(prediction power)が 1 となっていることに気づきました。
このスコアの原因は何でしょうか?正解:A
SageMaker Data Wrangler の Prediction Power は、ある特徴量がターゲット変数をどれだけ予測できるかを示す指標です。
- スコアが 1 というのは「その特徴量だけでターゲット変数を完全に予測できる」ことを意味します。
- 通常の現実的なデータでそのような結果が出ることは極めて稀で、多くの場合 ターゲットリーケージ(目的変数に直接的に関連する情報が特徴量として含まれてしまっている状態)が起きていることを示唆します。

コメント