AIF-C01#61(fundamentals-generative-ai)

AIF-C01#61(fundamentals-generative-ai)
ある企業が、アプリケーションを構築するために生成AIモデルを選択する必要があります。このアプリケーションは、ユーザーに対してリアルタイム(実時間)で回答を提供しなければなりません。 この要件を満たすために、企業が考慮すべきモデルの特性はどれですか?

正解:C

正解の根拠

推論速度 (Inference Speed) はモデルが入力を受け取ってから応答を返すまでの所要時間で、レイテンシと呼ばれます。リアルタイムアプリケーションでは数百ミリ秒以下の応答性が求められるため、モデルパラメータ数、量子化、Provisioned Throughput や SageMaker リアルタイムエンドポイントの選択など、推論速度を最適化する設計が必須です。

モデル選定時の考慮要素

特性意味
Inference Speed応答までのレイテンシ
Model Complexityパラメータ数や層構造
Training Timeモデル学習にかかる時間
Accuracy予測の正確性

不正解の理由

  • A: モデル複雑さは精度に影響しますが、リアルタイム応答性を直接保証する指標ではありません。
  • B: イノベーション速度はベンダー側の進化ペースで、運用要件としての応答性とは別概念です。
  • D: 学習時間は訓練フェーズの時間であり、本番推論時のレイテンシとは異なります。

参考:Bedrock Inference


コメント

コメント

コメントする

目次