Question#4(MLS-C01)

オンライン配送会社は、注文が行われた瞬間に各配達に最も速い宅配業者を選択したいと考えています。この機能は既存ユーザーと新規ユーザーの双方に対して実装したいと考えています。データサイエンティストはこの目的で XGBoost を用いて都市ごとに個別のモデルを学習し、Amazon S3 に保存しています。

オペレーションエンジニアは、Web クライアントからのリクエストに応答するために Amazon EC2 上でこれらのモデルをホスティングしており、モデルごとに 1 台のインスタンスを割り当てていますが、CPU とメモリの使用率はわずか 5% です。オペレーションエンジニアは不要なリソースの管理を避けたいと考えています。最小の運用負荷で、この目標を達成できるソリューションはどれですか？

A. boto3 ライブラリで Amazon S3 からすべてのモデルを取得するための Amazon SageMaker ノートブックインスタンスを作成する。既存インスタンスを削除し、SageMaker バッチ変換を用いて全都市・全ユーザーの推論をオフラインで実行し、結果を Amazon S3 の別々のファイルに保存する。Web クライアントはそのファイルを参照するようにする。
B. オープンソースのマルチモデルサーバーに基づく Amazon SageMaker 用の Docker コンテナを準備する。既存インスタンスを削除し、代わりに全モデルを含む S3 バケットを指すマルチモデルエンドポイントを SageMaker 上に作成する。実行時にはリクエストの都市に応じて TargetModel パラメータを指定してエンドポイントを呼び出す。
C. すべてのモデルをホストするための単一の EC2 インスタンスだけを残す。インスタンスにモデルサーバーをインストールし、Amazon S3 から各モデルをロードする。Amazon API Gateway を用いて Web クライアントとリアルタイム連携し、都市に応じて対象リソースを指定する。
D. Amazon SageMaker の事前構築イメージに基づく Docker コンテナを準備する。既存インスタンスを、会社が展開している各都市ごとに別々の SageMaker エンドポイントに置き換える。Web クライアントは都市に応じて URL と EndpointName を指定してエンドポイントを呼び出す。

正解と解説ディスカッション 0

正解：B

本件の課題は、都市ごとに多数のモデルをリアルタイム推論で使い分けたい一方、都市ごとに専用のインフラ（EC2／エンドポイント）を持つと 使用率が低く運用負荷とコストが無駄 になる、という点にあります。Amazon SageMaker の マルチモデルエンドポイント（MME） は、単一エンドポイントで複数モデルをホストし、モデルアーティファクトは S3 からオンデマンドにロード／アンロード され、リクエスト時に TargetModel ヘッダーで使用するモデルを切り替えられます。これにより、インスタンス台数やエンドポイント数を最小化しつつ、同じ計算リソースを多モデルで共有できるため、最小の運用負荷でスケール できるのが２です。

Question#4(MLS-C01)

コメント

コメント

コメントするコメントをキャンセル

コメント

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル