AIF-C01#53(foundation-models)

AIF-C01#53(foundation-models)
ある企業が、Amazon Bedrock の既存の基盤モデル(LLM)をファインチューニングして、カスタムモデルを作成しました。この企業は、そのモデルを本番環境にデプロイし、毎分一定の割合(steady rate)のリクエストを処理するために使用したいと考えています。 これらの要件を最もコスト効率よく満たすソリューションはどれですか?

正解:D

正解の根拠

Bedrock のカスタムモデル (FT したモデル) を本番利用するには、Provisioned Throughput でモデル容量を予約する必要があります。毎分一定量のリクエストを処理する定常ワークロードでは、時間単位のコミットで単価が下がる Provisioned Throughput が最もコスト効率に優れ、安定したスループットを保証します。

Bedrock 課金モデルの比較

方式適合用途
On-Demand変動量、PoC
Provisioned Throughput定常量、本番
Custom ModelFT モデルは PT 必須
EC2 自前運用負荷大

不正解の理由

  • A: 自前 EC2 ホスティングは GPU 管理やスケール運用負荷が大きく、Bedrock のマネージド利用と比べてコスト効率が劣ります。
  • B: カスタムモデル (FT 済み) は On-Demand で呼び出せず、Provisioned Throughput 必須のため要件を満たせません。
  • C: S3 + Lambda は LLM 推論基盤として GPU やメモリ要件を満たせず、現実的な FM ホスティング方式ではありません。

参考:Bedrock Provisioned Throughput


コメント

コメント

コメントする

目次