AI901-Concept#41
Transformer アーキテクチャが現代の大規模言語モデル (LLM) で基盤として広く採用されている主な理由として、最も適切なものはどれですか?
解説
【正解: B】の理由
Transformer は self-attention により系列の任意位置同士の関係を一度に評価でき、並列計算と長距離依存の学習を両立します。これが LLM / multimodal モデル / Azure OpenAI で採用される主要因です。
【他選択肢が違う理由】
Transformer は self-attention により系列の任意位置同士の関係を一度に評価でき、並列計算と長距離依存の学習を両立します。これが LLM / multimodal モデル / Azure OpenAI で採用される主要因です。
【他選択肢が違う理由】
- A: CNN の特徴で Transformer の主役ではありません。
- C: Transformer 自体は順次強制せず、推論時の決定性は別軸の話です。
- D: RNN の特徴で、Transformer は双方向の attention を活用します。

コメント