AI901-Foundry#167
GPT-4o multimodal に画像を入力する標準的な方法として、最も適切なものはどれですか?
解説
【正解: B】の理由
GPT-4o multimodal は Chat Completions API の
【他選択肢が違う理由】
GPT-4o multimodal は Chat Completions API の
messages 配列で、user メッセージの content を配列形式にし、{type: "text", text: "..."} と {type: "image_url", image_url: {url: "https://... または data:image/png;base64,..."}} を組み合わせることで、テキストと画像を同一プロンプトに混在させて送信できます。複数画像も並べられ、画像ごとに detail (low / high / auto) を指定可能です。Microsoft Learn の GPT-4o quickstart に明記された標準パターンです。【他選択肢が違う理由】
- A: Storage Key 埋め込みは推奨されない悪手で、不要です。
- C: GPT-4o は画像入力を直接サポートします。
- D: 専用エンドポイント分離は仕様ではありません。

コメント