Question#64(MLS-C01)

Question#64(MLS-C01)

金融企業は、5,000社の上場企業の株価リターンのデータを収集しました。金融アナリストは、各企業について2,000の属性を含むデータセットを持っています。金融アナリストは、Amazon SageMakerを使用して、将来の株価リターンを予測するのに最も価値のある上位15の属性を特定したいと考えています。これらの要件を最小限の運用オーバーヘッドで満たすソリューションはどれですか?

正解:D

SageMaker Autopilotは、機械学習モデルの構築プロセスを自動化するサービスで、データ前処理、アルゴリズム選択、ハイパーパラメータチューニング、モデル評価を自動で行います。5,000社×2,000属性のデータセットに対して、Autopilotは複数の回帰モデル(例: 線形回帰、XGBoost、ランダムフォレストなど)を試し、最適なモデルを自動的に選択します。この自動化により、データ前処理やハイパーパラメータ調整の手動作業が不要となり、運用オーバーヘッドが大幅に軽減されます。さらに、Autopilotは特徴量重要度を自動で計算し、SageMaker Clarifyと統合して特徴量の予測力を評価できます。SageMaker Clarifyは、モデルの説明性分析を提供し、SHAP値(Shapley Additive Explanations)などを使用して、どの属性が株価リターンの予測に最も寄与しているかを正確に特定します。Clarifyレポートを活用することで、上位15の属性を信頼性の高い方法で選択可能です。AutopilotとClarifyの組み合わせは、データ前処理からモデル構築、特徴量選択までを一貫して自動化し、運用オーバーヘッドを最小限に抑えながら、複雑なデータセットに対応する高精度なモデルを提供します。したがって、選択肢4は迅速かつ効率的に要件を満たし、正解です。


コメント

コメント

コメントする

目次