PMLE#2(model-architecture)
画像分類タスクで、224x224 のカラー画像 10 万枚を学習させる必要があります。最も適したモデルアーキテクチャはどれですか。
正解:C
正解の根拠
画像のような空間的局所性を持つデータには CNN が最適です。畳み込み層がエッジやテクスチャ等の局所特徴を階層的に抽出し、平行移動不変性も自然に得られます。ResNet や EfficientNet は ImageNet での事前学習重みも豊富です。
| データ | 推奨アーキテクチャ |
|---|---|
| 画像 | CNN, Vision Transformer |
| 系列 | RNN, Transformer |
| 表形式 | 勾配ブースティング |
不正解の理由
- B: RNN は系列データ向けで、画像の空間構造を十分活用できません
- A: 線形モデルでは複雑な視覚パターンを捉えられません
- D: 単体決定木は画素入力に対して表現力が不足します

コメント