AIF-C01#28(fundamentals-generative-ai)

ある企業が、大量のデータから複数のプロンプトに対して合成データのレスポンスを生成したいと考えています。企業はAPIメソッドを使用してレスポンスを生成したいと考えていますが、レスポンスを即座に生成する必要はありません。最も少ない開発工数でこれらの要件を満たすソリューションはどれですか？

A. モデルにプロンプトを入力し、「リアルタイム推論」を使用してレスポンスを生成する。
B. 「Amazon Bedrock バッチ推論（Batch Inference）」を使用し、非同期でレスポンスを生成する。
C. 「Amazon Bedrock エージェント」を使用し、プロンプトを再帰的に処理するエージェントシステムを構築する。
D. 「AWS Lambda」関数を使用してタスクを自動化する。プロンプトを一つずつ送信し、各レスポンスを保存する。

正解と解説ディスカッション 0

正解：B

正解の根拠

Amazon Bedrock Batch Inference は、S3 上の大量のプロンプトをまとめて非同期に処理し、結果を S3 に出力するモードです。リアルタイム性が不要で大量の合成データ生成のような用途に最適で、オンデマンドより低単価で利用できコスト効率に優れます。API 一発でジョブ送信できるため開発工数も最小です。

Bedrock 推論モード比較

モード	用途
Batch Inference	大量・非同期処理
On-demand	リアルタイム単発呼出
Provisioned Throughput	高負荷の安定スループット
Agents	多段推論+API 連携

不正解の理由

A: リアルタイム推論は即応用途向けで、大量処理には呼出オーバーヘッドが大きくコストも非効率になります。
C: Bedrock Agents は多段推論が必要なタスク向けで、単純な大量プロンプト処理には機能過剰で工数が増えます。
D: Lambda で逐次呼出する自前実装は再試行・並列度・S3 連携を作り込む必要があり、Batch 機能より工数大です。

参考：Bedrock Batch Inference

AIF-C01#28(fundamentals-generative-ai)

正解の根拠

Bedrock 推論モード比較

不正解の理由

コメント

コメント

コメントするコメントをキャンセル

正解の根拠

Bedrock 推論モード比較

不正解の理由

コメント

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル