AIF-C01#53(foundation-models)
ある企業が、Amazon Bedrock の既存の基盤モデル(LLM)をファインチューニングして、カスタムモデルを作成しました。この企業は、そのモデルを本番環境にデプロイし、毎分一定の割合(steady rate)のリクエストを処理するために使用したいと考えています。 これらの要件を最もコスト効率よく満たすソリューションはどれですか?
正解:D
正解の根拠
Bedrock のカスタムモデル (FT したモデル) を本番利用するには、Provisioned Throughput でモデル容量を予約する必要があります。毎分一定量のリクエストを処理する定常ワークロードでは、時間単位のコミットで単価が下がる Provisioned Throughput が最もコスト効率に優れ、安定したスループットを保証します。
Bedrock 課金モデルの比較
| 方式 | 適合用途 |
|---|---|
| On-Demand | 変動量、PoC |
| Provisioned Throughput | 定常量、本番 |
| Custom Model | FT モデルは PT 必須 |
| EC2 自前 | 運用負荷大 |
不正解の理由
- A: 自前 EC2 ホスティングは GPU 管理やスケール運用負荷が大きく、Bedrock のマネージド利用と比べてコスト効率が劣ります。
- B: カスタムモデル (FT 済み) は On-Demand で呼び出せず、Provisioned Throughput 必須のため要件を満たせません。
- C: S3 + Lambda は LLM 推論基盤として GPU やメモリ要件を満たせず、現実的な FM ホスティング方式ではありません。

コメント