Question#4(MLS-C01)

Question#4(MLS-C01)

オンライン配送会社は、注文が行われた瞬間に各配達に最も速い宅配業者を選択したいと考えています。この機能は既存ユーザーと新規ユーザーの双方に対して実装したいと考えています。データサイエンティストはこの目的で XGBoost を用いて都市ごとに個別のモデルを学習し、Amazon S3 に保存しています。

オペレーションエンジニアは、Web クライアントからのリクエストに応答するために Amazon EC2 上でこれらのモデルをホスティングしており、モデルごとに 1 台のインスタンスを割り当てていますが、CPU とメモリの使用率はわずか 5% です。オペレーションエンジニアは不要なリソースの管理を避けたいと考えています。 最小の運用負荷で、この目標を達成できるソリューションはどれですか?
ディスカッション 0

正解:B

本件の課題は、都市ごとに多数のモデルをリアルタイム推論で使い分けたい一方、都市ごとに専用のインフラ(EC2/エンドポイント)を持つと 使用率が低く運用負荷とコストが無駄 になる、という点にあります。Amazon SageMaker の マルチモデルエンドポイント(MME) は、単一エンドポイントで複数モデルをホストし、モデルアーティファクトは S3 からオンデマンドにロード/アンロード され、リクエスト時に TargetModel ヘッダーで使用するモデルを切り替えられます。これにより、インスタンス台数やエンドポイント数を最小化しつつ、同じ計算リソースを多モデルで共有できるため、最小の運用負荷でスケール できるのが 2 です。


コメント

コメント

コメントする

目次