Question#8(MLS-C01)
ある企業は、モーターエンジンや工場機械などのデバイスに搭載されたセンサーを使用して、温度や圧力などのパラメータを測定しています。企業はセンサーデータを使用して、機器の故障を予測し、サービス停止を削減したいと考えています。機械学習(ML)スペシャリストは、機器の故障を予測するモデルをトレーニングするためにセンサーデータを収集する必要があります。MLスペシャリストは、モデルをトレーニングする前にデータに外れ値が含まれていないことを確認する必要があります。これらの要件を最小の運用オーバーヘッドで満たすにはどうすればよいですか?
正解:C
Amazon SageMaker Data Wranglerは、データ前処理に特化したGUIベースのツールであり、異常検出ビジュアライゼーション機能を提供します。この機能を使用すると、センサーデータ(温度や圧力など)における外れ値を視覚的に特定でき、データサイエンティストは異常値を直感的に確認できます。Data Wranglerデータフローに変換ステップ(例: 外れ値の閾値に基づくフィルタリング)を追加することで、外れ値を簡単に削除できます。GUIベースの操作はコード記述を最小限に抑え、データ準備のプロセスを効率化するため、運用オーバーヘッドが低く抑えられます。また、Data WranglerはSageMakerエコシステムと統合されており、モデルトレーニングへの移行もスムーズです。このアプローチは、時系列データの外れ値検出と削除に特化しており、要件に最適です。

コメント