MENU

会員登録（無料）

PMLE#5(serving-scaling)

この問題のディスカッション

PMLE#5(serving-scaling)

大規模なディープラーニングモデルを GPU 推論したいです。Vertex AI Online Prediction で利用するべきリソース構成はどれですか。

A. e2-micro 単独で十分であり、GPU やアクセラレータを追加しなくても大規模ディープラーニングモデルの推論性能を満たせます
B. n1-standard-4 にアクセラレータとして NVIDIA T4 を追加します
C. f1-micro に TPU v2 を追加し、最小構成のままで GPU 推論ワークロードを安定して実行できるよう設定します
D. BigQuery slot を割り当て、SQL クエリ用のスロット予約をオンライン推論用リソースとして転用します

正解と解説ディスカッション 0

正解：B

正解の根拠

Vertex AI Endpoint は n1-standard 系などのマシンタイプに対し T4 / V100 / A100 などの GPU を accelerator として追加できます。深層学習推論は GPU により大幅に高速化します。

用途	推奨
軽量 ML	n1-standard CPU
DL 推論	n1-standard + T4
大規模 LLM	A2/G2 + A100/L4

不正解の理由

B は本番推論には不十分です。
C は f1-micro が Vertex AI のサポート対象外です。
D は推論ではなく分析用リソースです。

参考：Vertex AI マシンタイプと GPU

コメント

コメント

コメントするコメントをキャンセル