Question#63(MLS-C01)

Question#63(MLS-C01)

データサイエンティストは、詐欺を検出するモデルを開発する必要があります。データサイエンティストは、正当な取引に比べて詐欺取引のデータが少ない状況です。データサイエンティストは、モデルを最終化する前にモデルのバイアスを確認する必要があります。また、モデルを迅速に開発する必要があります。これらの要件を最小限の運用オーバーヘッドで満たすソリューションはどれですか?

正解:C

この選択肢は、すべてのプロセスをSageMakerエコシステム内で完結させるため、運用オーバーヘッドが最小限に抑えられます。まず、SageMaker Studio内でSMOTEを適用してクラスの不均衡を軽減します。SageMaker Studioは、データ前処理のための統合環境(例: Data Wrangler)を提供し、SMOTEの実装がノートブックや組み込み機能を通じて簡単に実行可能です。EMRのような別クラスタの管理が不要なため、運用負荷が低減されます。次に、SageMaker JumpStartを使用することで、事前構築されたモデルやスクリプトを活用して詐欺検出モデルを迅速に開発できます。JumpStartは、モデル選択、トレーニング、デプロイを簡素化し、迅速な開発要件を満たします。最後に、SageMaker Clarifyを使用してバイアスを確認します。Clarifyは、モデルのバイアス分析(例: クラス不均衡による偏りや特徴量の偏見)を効率的に実行し、バイアス指標(例: 差分影響、条件付き人口統計学的差異)を計算するのに特化しています。すべてのプロセスがSageMaker内で一貫して実行されるため、ツール間の統合や管理が最小限で済み、運用オーバーヘッドが最も低くなります。この選択肢は、迅速な開発とバイアスチェックの要件を満たし、正解です。


コメント

コメント

コメントする

目次