Question#47(MLS-C01)

Question#47(MLS-C01)

ある企業は、リモートサイトのデバイスからリアルタイムデータを用いた予知保全システムを構築しています。サイトと企業のVPCの間にはAWS Direct Connect接続やVPN接続がありません。データはデバイスからリアルタイムでAmazon S3に取り込む必要があります。生データを機械学習(ML)モデルに供給するために、クリーンな.csvデータに変換する処理が必要です。この変換は取り込みプロセス中に行う必要があります。変換が失敗したレコードは、人のレビュー用にAmazon S3の特定の場所に保存する必要があります。変換前の生データもAmazon S3に保存する必要があります。MLスペシャリストは、最小の労力でこれらの要件を満たすソリューションをどのように設計すべきですか?

正解:A

Amazon Data FirehoseをS3宛先として使用し、Lambda関数でデータ変換を行い、ソースレコードバックアップを有効にするアプローチは、要件を満たす最もシンプルで効率的なソリューションです。Firehoseは、デバイスからリアルタイムデータを直接受信し、S3に保存する機能を備えています。Lambda関数を統合することで、生データを.csv形式に変換するカスタムロジックを実装でき、変換に失敗したレコードはFirehoseのエラー出力設定によりS3の指定プレフィックスに自動保存されます。ソースレコードバックアップ機能により、変換前の生データもS3に保存され、すべてのデータ保存要件が満たされます。Firehoseはサーバーレスで自動スケーリングが可能であり、設定は数ステップで完了するため、運用労力が最小限です。Lambda関数の実装は必要ですが、これはデータ変換ロジックに限定され、インフラストラクチャ管理はFirehoseが担当するため、全体の労力は低いです。このソリューションは、AWSのマネージドサービスを最大限活用し、迅速な実装とメンテナンスの容易さを提供します。


コメント

コメント

コメントする

目次