AIF-C01#54(foundation-models)

AIF-C01#54(foundation-models)
ある企業が、生成AIを使用した編集アシスタントアプリケーションを開発しています。パイロットフェーズ(試用期間)では利用率が低く、アプリケーションのパフォーマンスは懸念事項ではありません。この企業は、フルデプロイ後の利用状況を予測できず、アプリケーションのコストを最小限に抑えたいと考えています。 これらの要件を満たすソリューションはどれですか?

正解:C

正解の根拠

パイロット段階で利用率が低く今後の使用量が読めない場合、トークン単位の従量課金である Bedrock On-Demand Throughput が最もコスト効率に優れます。事前コミット不要で、利用がゼロなら課金もゼロに近づくため、不確実なトラフィックに対するリスクを最小化できます。

Bedrock 課金モデルの比較

方式性質
On-Demand従量、変動量に最適
Provisioned Throughput定常大量、前払割引
EC2 GPU自前運用、固定コスト
JumpStartSageMaker でホスト

不正解の理由

  • A: GPU EC2 は起動中ずっと固定コストが発生し、利用が読めず低使用率の段階ではコスト効率が著しく悪化します。
  • B: Provisioned Throughput は時間単位コミット方式で、量が読めない段階ではアイドルコストが発生し過剰投資になります。
  • D: JumpStart は SageMaker エンドポイントを稼働させ続ける必要があり、変動量・低使用率の状況では割高になります。

参考:Bedrock On-Demand


コメント

コメント

コメントする

目次