PMLE#5(serving-scaling)
大規模なディープラーニングモデルを GPU 推論したいです。Vertex AI Online Prediction で利用するべきリソース構成はどれですか。
正解:B
正解の根拠
Vertex AI Endpoint は n1-standard 系などのマシンタイプに対し T4 / V100 / A100 などの GPU を accelerator として追加できます。深層学習推論は GPU により大幅に高速化します。
| 用途 | 推奨 |
|---|---|
| 軽量 ML | n1-standard CPU |
| DL 推論 | n1-standard + T4 |
| 大規模 LLM | A2/G2 + A100/L4 |
不正解の理由
- B は本番推論には不十分です。
- C は f1-micro が Vertex AI のサポート対象外です。
- D は推論ではなく分析用リソースです。

コメント