PMLE#2(model-architecture)

PMLE#2(model-architecture)

画像分類タスクで、224x224 のカラー画像 10 万枚を学習させる必要があります。最も適したモデルアーキテクチャはどれですか。

ディスカッション 0

正解:C

正解の根拠

画像のような空間的局所性を持つデータには CNN が最適です。畳み込み層がエッジやテクスチャ等の局所特徴を階層的に抽出し、平行移動不変性も自然に得られます。ResNet や EfficientNet は ImageNet での事前学習重みも豊富です。

データ推奨アーキテクチャ
画像CNN, Vision Transformer
系列RNN, Transformer
表形式勾配ブースティング

不正解の理由

  • B: RNN は系列データ向けで、画像の空間構造を十分活用できません
  • A: 線形モデルでは複雑な視覚パターンを捉えられません
  • D: 単体決定木は画素入力に対して表現力が不足します

参考:Vertex AI トレーニング概要


コメント

コメント

コメントする

目次