AIF-C01#31(fundamentals-generative-ai)
ある企業が、ユーザーにサービスの見積もりをリアルタイム(real-time)で提示するために生成AIモデルを使用することを計画しています。 このユースケースに最適なモデルを選択するために、企業はどの基準を使用すべきですか?
正解:D
正解の根拠
リアルタイム見積提示では応答時間がユーザー体験を左右するため、モデルのレイテンシと推論スピードの最適化が選定基準として最重要です。Bedrock では Provisioned Throughput や軽量モデル選択でスループットを確保でき、SageMaker では推論コンテナの高速化や量子化で低遅延を実現できます。
リアルタイム推論の評価軸
| 軸 | 意義 |
|---|---|
| レイテンシ | UX に直結 |
| スループット | 同時リクエスト捌き |
| 精度 | 見積妥当性 |
| コスト | 長期運用性 |
不正解の理由
- A: モデルサイズは間接指標であり、最終的なレイテンシそのものを直接保証するものではありません。
- B: 訓練データ品質は精度には効きますが、リアルタイム性の選定基準としては第一義ではありません。
- C: 高性能 GPU 可用性はインフラ要件で、モデル選定基準というよりデプロイ環境設計の話です。

コメント