PMLE#5(serving-scaling)

PMLE#5(serving-scaling)

大規模なディープラーニングモデルを GPU 推論したいです。Vertex AI Online Prediction で利用するべきリソース構成はどれですか。

ディスカッション 0

正解:B

正解の根拠

Vertex AI Endpoint は n1-standard 系などのマシンタイプに対し T4 / V100 / A100 などの GPU を accelerator として追加できます。深層学習推論は GPU により大幅に高速化します。

用途推奨
軽量 MLn1-standard CPU
DL 推論n1-standard + T4
大規模 LLMA2/G2 + A100/L4

不正解の理由

  • B は本番推論には不十分です。
  • C は f1-micro が Vertex AI のサポート対象外です。
  • D は推論ではなく分析用リソースです。

参考:Vertex AI マシンタイプと GPU


コメント

コメント

コメントする

目次