AIF-C01#28(fundamentals-generative-ai)
ある企業が、大量のデータから複数のプロンプトに対して合成データのレスポンスを生成したいと考えています。企業はAPIメソッドを使用してレスポンスを生成したいと考えていますが、レスポンスを即座に生成する必要はありません。 最も少ない開発工数でこれらの要件を満たすソリューションはどれですか?
正解:B
正解の根拠
Amazon Bedrock Batch Inference は、S3 上の大量のプロンプトをまとめて非同期に処理し、結果を S3 に出力するモードです。リアルタイム性が不要で大量の合成データ生成のような用途に最適で、オンデマンドより低単価で利用できコスト効率に優れます。API 一発でジョブ送信できるため開発工数も最小です。
Bedrock 推論モード比較
| モード | 用途 |
|---|---|
| Batch Inference | 大量・非同期処理 |
| On-demand | リアルタイム単発呼出 |
| Provisioned Throughput | 高負荷の安定スループット |
| Agents | 多段推論+API 連携 |
不正解の理由
- A: リアルタイム推論は即応用途向けで、大量処理には呼出オーバーヘッドが大きくコストも非効率になります。
- C: Bedrock Agents は多段推論が必要なタスク向けで、単純な大量プロンプト処理には機能過剰で工数が増えます。
- D: Lambda で逐次呼出する自前実装は再試行・並列度・S3 連携を作り込む必要があり、Batch 機能より工数大です。

コメント