AIF-C01#108(fundamentals-generative-ai)
ある企業は、Amazon SageMaker を使用して本番環境で ML パイプラインを運用しています。同社は、最大 1 GB の大規模な入力データサイズと最大 1 時間の処理時間を持つモデルを使用していますが、ほぼリアルタイムの低遅延を求めています。 この要件を満たす SageMaker の推論オプションはどれですか?
正解:C
正解の根拠
SageMaker Asynchronous Inference (非同期推論) は、最大 1 GB のペイロードと最大 1 時間の処理時間に対応し、内部キューで処理しながらクライアントへほぼリアルタイムに結果を返せる推論オプションです。リアルタイム推論の制約 (6 MB / 60 秒) を超える大きなジョブで、それでも低遅延を求めるシナリオに最適です。
SageMaker 推論オプション比較
| 推論タイプ | 適用範囲 |
|---|---|
| 非同期推論 | ~1GB / ~1h、低遅延要件 |
| リアルタイム推論 | ~6MB / ~60s、即時応答 |
| サーバーレス推論 | ~6MB、間欠ワークロード |
| バッチ変換 | ~100MB / 大量データ一括 |
不正解の理由
- A: リアルタイム推論はペイロード 6 MB / 処理 60 秒の制約があり、本問の 1 GB / 1 時間要件を満たせません。
- B: サーバーレス推論はペイロード 6 MB 程度と小さく、間欠的な軽量ワークロード向けで大規模ジョブには不適合です。
- D: バッチ変換は完全オフラインの一括処理で、ほぼリアルタイムの低遅延要件には合致しません。

コメント