MENU

会員登録（無料）

PMLE#4(serving-scaling)

この問題のディスカッション

PMLE#4(serving-scaling)

Vertex AI Endpoint で自動スケーリングを設定したいです。指定するべきパラメータを 2 つ選択してください。

（2つ選択）

A. min_replica_count
B. max_replica_count
C. target_request_per_minute_only
D. endpoint_dns_name

正解と解説ディスカッション 0

正解：A, B

正解の根拠

Vertex AI のオンライン予測オートスケーリングはレプリカ数の下限と上限で制御します。最低レプリカで定常待機し、上限まで需要に応じて拡張します。CPU や GPU 使用率に基づくターゲット利用率も別途指定できます。

パラメータ	役割
min_replica_count	常時稼働数
max_replica_count	最大スケールアウト数
autoscaling_metric_specs	ターゲット利用率

不正解の理由

C は実在しない API パラメータです。
D はエンドポイントの識別であり、スケーリング制御ではありません。
E はネットワーク設定であり対象外です。

参考：Vertex AI コンピュート構成

コメント

コメント

コメントするコメントをキャンセル