AIF-C01#14(foundation-models)
Amazon Bedrockにおいて、テキスト、画像、およびビデオの理解(Comprehension)のためにファインチューニングが可能な基盤モデル(FM)はどれですか?
正解:A
正解の根拠
Amazon Nova Pro はテキスト/画像/ビデオ入力をサポートする高機能マルチモーダル基盤モデルで、Bedrock 上でファインチューニングが可能です。文書分析、画像理解、ビデオ要約など幅広いマルチモーダル理解タスクに対応します。Nova ファミリでファインチューニングと多モダリティ理解を両立する代表モデルです。
Nova ファミリ比較
| モデル | 特徴 |
|---|---|
| Nova Pro | マルチモーダル、ファインチューニング可 |
| Nova Micro | テキスト専用、低コスト/高速 |
| Nova Lite | マルチモーダル、低コスト |
| Titan Multimodal Embeddings | 埋め込み生成専用 |
不正解の理由
- B: Titan Multimodal Embeddings G1 はベクトル埋め込み生成用で、ファインチューニングによる理解タスク改善対象のモデルではありません。
- C: Titan Text G1 - Express はテキスト生成用で、画像やビデオの理解 (マルチモーダル入力) には対応していません。
- D: Nova Micro はテキスト専用の軽量モデルで、画像やビデオの理解を行うマルチモーダル機能を備えていません。

コメント