AIF-C01#31(fundamentals-generative-ai)

AIF-C01#31(fundamentals-generative-ai)
ある企業が、ユーザーにサービスの見積もりをリアルタイム(real-time)で提示するために生成AIモデルを使用することを計画しています。 このユースケースに最適なモデルを選択するために、企業はどの基準を使用すべきですか?

正解:D

正解の根拠

リアルタイム見積提示では応答時間がユーザー体験を左右するため、モデルのレイテンシと推論スピードの最適化が選定基準として最重要です。Bedrock では Provisioned Throughput や軽量モデル選択でスループットを確保でき、SageMaker では推論コンテナの高速化や量子化で低遅延を実現できます。

リアルタイム推論の評価軸

意義
レイテンシUX に直結
スループット同時リクエスト捌き
精度見積妥当性
コスト長期運用性

不正解の理由

  • A: モデルサイズは間接指標であり、最終的なレイテンシそのものを直接保証するものではありません。
  • B: 訓練データ品質は精度には効きますが、リアルタイム性の選定基準としては第一義ではありません。
  • C: 高性能 GPU 可用性はインフラ要件で、モデル選定基準というよりデプロイ環境設計の話です。

参考:SageMaker Real-time Endpoints


コメント

コメント

コメントする

目次