AI901-Foundry#169 | CloudCamp｜クラウド資格のWEB問題集

AI901-Foundry#169

GPT-4o multimodal が単機能 Vision API (Image Analysis / Custom Vision) より特に有効になるユースケースを 2 つ選択してください。

2 つ選択してください

A. 画像内の状況を読み解いて、文脈に沿った自由応答 (例: 「この機器のエラー表示の意味と次の手順を説明して」) を返す必要がある B. 1 日 100 万枚の画像から特定 SKU の bounding box を低単価で大量検出するだけのバッチ処理 C. 事前学習済みの「物体検出」「OCR」だけで完結する固定タスクを最低単価で運用したい D. 画像 + テキスト + 過去ターンの会話履歴を組み合わせて、対話型のサポートアシスタントを構築する E. 音声波形を文字起こしする必要がある

ディスカッション 0

解説

コメント

コメントするコメントをキャンセル

解説

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル