AI901-Foundry#216
Content Understanding の Video analyzer が内部的に組み合わせている下位機能の組み合わせとして、最も適切なものはどれですか?
解説
【正解: B】の理由
Video analyzer は内部的に複数の下位機能を組み合わせる「上位レイヤー」の抽象化です。シーン検出により動画を意味的に区切り、各シーンのフレームに対して Vision の物体検出 / OCR を適用、音声トラックに対し Speech-to-Text で transcript を生成、それらの結果に対して LLM 推論を加えて analyzer スキーマで定義された業務フィールドを構造化 JSON で出力します。Microsoft Learn の Content Understanding Video analyzer documentation に内部アーキテクチャの概要が示されています。
【他選択肢が違う理由】
Video analyzer は内部的に複数の下位機能を組み合わせる「上位レイヤー」の抽象化です。シーン検出により動画を意味的に区切り、各シーンのフレームに対して Vision の物体検出 / OCR を適用、音声トラックに対し Speech-to-Text で transcript を生成、それらの結果に対して LLM 推論を加えて analyzer スキーマで定義された業務フィールドを構造化 JSON で出力します。Microsoft Learn の Content Understanding Video analyzer documentation に内部アーキテクチャの概要が示されています。
【他選択肢が違う理由】
- A / C / D: いずれも別領域のインフラ / データ / 認証サービスで、Video analyzer の本質的な構成要素ではありません。

コメント