MLS-C01#5(ml-operations)
あるフィンテック企業は、月初のみアクセスが集中するクレジットスコアリングモデルを Amazon SageMaker で提供しています。それ以外の期間はリクエストがほぼゼロですが、月初に瞬時に応答する必要があります。最適なエンドポイント構成はどれですか。
正解:B
正解の根拠
Serverless Inference はトラフィックが無いときはゼロスケールしてコストを発生させず、必要な時だけ起動します。Provisioned Concurrency を設定すると指定数のワーカーが事前ウォームアップされ、コールドスタート遅延を排除して即応性を確保できます。月初のみ集中する負荷パターンに最適です。
| 構成 | アイドルコスト | 応答性 | 運用負荷 |
|---|---|---|---|
| Serverless + PC | 低い | 高い | 低い |
| 常時稼働 | 非常に高い | 高い | 低い |
| Batch Transform | 低い | 低い (即応不可) | 低い |
| 独自 EC2 | 低い | 中程度 | 非常に高い |
不正解の理由
- A: 常時 4 台稼働は無トラフィック期間にも高額な料金が継続して発生します
- C: Batch Transform は同期応答ができず、リアルタイムスコアリングには不適です
- D: 独自 EC2 構築は SageMaker のマネージドメリットを失い運用負荷が上がります

コメント