AIF-C01#61(fundamentals-generative-ai)
ある企業が、アプリケーションを構築するために生成AIモデルを選択する必要があります。このアプリケーションは、ユーザーに対してリアルタイム(実時間)で回答を提供しなければなりません。 この要件を満たすために、企業が考慮すべきモデルの特性はどれですか?
正解:C
正解の根拠
推論速度 (Inference Speed) はモデルが入力を受け取ってから応答を返すまでの所要時間で、レイテンシと呼ばれます。リアルタイムアプリケーションでは数百ミリ秒以下の応答性が求められるため、モデルパラメータ数、量子化、Provisioned Throughput や SageMaker リアルタイムエンドポイントの選択など、推論速度を最適化する設計が必須です。
モデル選定時の考慮要素
| 特性 | 意味 |
|---|---|
| Inference Speed | 応答までのレイテンシ |
| Model Complexity | パラメータ数や層構造 |
| Training Time | モデル学習にかかる時間 |
| Accuracy | 予測の正確性 |
不正解の理由
- A: モデル複雑さは精度に影響しますが、リアルタイム応答性を直接保証する指標ではありません。
- B: イノベーション速度はベンダー側の進化ペースで、運用要件としての応答性とは別概念です。
- D: 学習時間は訓練フェーズの時間であり、本番推論時のレイテンシとは異なります。

コメント