AIF-C01#30(fundamentals-generative-ai)
ある企業が、車両の衝突を検知してから30秒以内に緊急通報を行うAIソリューションを統合したいと考えています。この企業は、追加のトレーニングを行わずに事前学習済みモデル(pre-trained model)を使用したいと考えています。 これらの要件を満たすモデルを選択する際、この企業はどの要因を最優先(prioritize)すべきですか?
正解:B
正解の根拠
30 秒以内に通報が必要なリアルタイム要件では、推論レイテンシが極めて重要です。一般にモデルサイズが小さいほど推論時間とリソース消費が低くなるため、追加学習を行わない事前学習済みモデルの中ではモデルサイズ (パラメータ数) を最優先に選定すべきです。Bedrock や SageMaker JumpStart で軽量モデルを選ぶことでエッジ寄りの低遅延配信も可能になります。
低遅延モデル選定の観点
| 観点 | 影響 |
|---|---|
| モデルサイズ | レイテンシに直結 |
| 精度 | 誤検知/見逃しに影響 |
| 推論コスト | 運用費に影響 |
| カスタマイズ性 | 追加学習しないので不要 |
不正解の理由
- A: カスタマイズ性は事前学習済みモデルをそのまま使う前提では不要で、本要件の最優先要素にはなりません。
- C: コストも重要ですが、人命に関わる 30 秒制約ではまず低遅延を満たすサイズの選定が優先されます。
- D: Temperature は推論時の出力ランダム性パラメータで、応答時間や精度の本質的決定要因ではありません。

コメント