Question#37(MLS-C01)

メディア企業は、Amazon SageMakerを使用して、読者に新しい記事を推薦する機械学習（ML）モデルをデプロイしたいと考えています。企業の読者は主に単一の都市に居住しています。企業は、読者トラフィックが朝早く、昼食後、仕事後の時間帯に予測可能なピークを迎え、他の時間帯ではトラフィックが非常に少ないことに気づいています。メディア企業は、読者に推薦を配信する時間を最小限に抑える必要があります。API呼び出しが推論のために返すデータの予想量は4MB未満です。以下のどのソリューションが、最もコスト効率よくこれらの要件を満たしますか？

A. 自動スケーリングを使用したリアルタイム推論
B. プロビジョニングされた同時実行を使用したサーバーレス推論
C. 非同期推論
D. バッチ変換タスク

正解と解説ディスカッション 0

正解：B

プロビジョニングされた同時実行を使用したサーバーレス推論は、低レイテンシーとコスト効率の両方を提供します。SageMakerサーバーレス推論は、サーバー管理をAWSに委ね、トラフィックに応じて自動的にスケーリングします。プロビジョニングされた同時実行を設定することで、朝早く、昼食後、仕事後のピーク時間帯にリソースを事前に確保し、推論のレイテンシーを最小限に抑えます。トラフィックが少ない時間帯にはリソースがスケールダウンされ、従量課金制によりコストが抑えられます。データサイズが4MB未満と小さいため、サーバーレス推論のメモリ制約（最大6GB）内に収まり、効率的に処理できます。このアプローチは、インフラストラクチャ管理の負担を排除し、ピーク時間帯のトラフィックパターンに適応しながらコストを最適化するため、メディア企業の要件に最適です。

Question#37(MLS-C01)

コメント

コメント

コメントするコメントをキャンセル

コメント

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル