PMLE#4(serving-scaling)

PMLE#4(serving-scaling)

Vertex AI Endpoint で自動スケーリングを設定したいです。指定するべきパラメータを 2 つ選択してください。

(2つ選択)

ディスカッション 0

正解:A, B

正解の根拠

Vertex AI のオンライン予測オートスケーリングはレプリカ数の下限と上限で制御します。最低レプリカで定常待機し、上限まで需要に応じて拡張します。CPU や GPU 使用率に基づくターゲット利用率も別途指定できます。

パラメータ役割
min_replica_count常時稼働数
max_replica_count最大スケールアウト数
autoscaling_metric_specsターゲット利用率

不正解の理由

  • C は実在しない API パラメータです。
  • D はエンドポイントの識別であり、スケーリング制御ではありません。
  • E はネットワーク設定であり対象外です。

参考:Vertex AI コンピュート構成


コメント

コメント

コメントする

目次