AI901-Foundry#166
GPT-4o multimodal モデルの中核となる特徴として、最も適切な説明はどれですか?
解説
【正解: D】の理由
GPT-4o は OpenAI が提供する multimodal モデルで、Azure OpenAI / Foundry 経由でデプロイし、テキストと画像を同じプロンプトに混在させて入力できます。画像の内容を理解したテキスト応答 (画像の説明 / OCR 的読み取り / 物体識別 / 文脈推論) を行え、視覚タスクと言語タスクを統合した複雑な質問応答に向きます。Azure 版ではプロンプト / 応答に対する Content Safety 統合が標準で、Responsible AI ガードが組み込まれています。
【他選択肢が違う理由】
GPT-4o は OpenAI が提供する multimodal モデルで、Azure OpenAI / Foundry 経由でデプロイし、テキストと画像を同じプロンプトに混在させて入力できます。画像の内容を理解したテキスト応答 (画像の説明 / OCR 的読み取り / 物体識別 / 文脈推論) を行え、視覚タスクと言語タスクを統合した複雑な質問応答に向きます。Azure 版ではプロンプト / 応答に対する Content Safety 統合が標準で、Responsible AI ガードが組み込まれています。
【他選択肢が違う理由】
- A: TTS は別サービスです。
- B: ネットワーク モニタリングは別領域です。
- C: Storage の自動最適化機能は別概念です。

コメント