MLS-C01#5(ml-operations)

MLS-C01#5(ml-operations)

あるフィンテック企業は、月初のみアクセスが集中するクレジットスコアリングモデルを Amazon SageMaker で提供しています。それ以外の期間はリクエストがほぼゼロですが、月初に瞬時に応答する必要があります。最適なエンドポイント構成はどれですか。

ディスカッション 0

正解:B

正解の根拠

Serverless Inference はトラフィックが無いときはゼロスケールしてコストを発生させず、必要な時だけ起動します。Provisioned Concurrency を設定すると指定数のワーカーが事前ウォームアップされ、コールドスタート遅延を排除して即応性を確保できます。月初のみ集中する負荷パターンに最適です。

構成アイドルコスト応答性運用負荷
Serverless + PC低い高い低い
常時稼働非常に高い高い低い
Batch Transform低い低い (即応不可)低い
独自 EC2低い中程度非常に高い

不正解の理由

  • A: 常時 4 台稼働は無トラフィック期間にも高額な料金が継続して発生します
  • C: Batch Transform は同期応答ができず、リアルタイムスコアリングには不適です
  • D: 独自 EC2 構築は SageMaker のマネージドメリットを失い運用負荷が上がります

参考:Serverless Inference


コメント

コメント

コメントする

目次