PMLE#4(serving-scaling)
Vertex AI Endpoint で自動スケーリングを設定したいです。指定するべきパラメータを 2 つ選択してください。
(2つ選択)
正解:A, B
正解の根拠
Vertex AI のオンライン予測オートスケーリングはレプリカ数の下限と上限で制御します。最低レプリカで定常待機し、上限まで需要に応じて拡張します。CPU や GPU 使用率に基づくターゲット利用率も別途指定できます。
| パラメータ | 役割 |
|---|---|
| min_replica_count | 常時稼働数 |
| max_replica_count | 最大スケールアウト数 |
| autoscaling_metric_specs | ターゲット利用率 |
不正解の理由
- C は実在しない API パラメータです。
- D はエンドポイントの識別であり、スケーリング制御ではありません。
- E はネットワーク設定であり対象外です。

コメント