AI901-Concept#170
以下の各ステートメントについて、Azure AI Foundry の音声 / 動画 information extraction の説明として正しい場合は「はい」を、正しくない場合は「いいえ」を選択してください。
注: 正解 1 つにつき 1 点が与えられます。
| ステートメント | はい | いいえ |
|---|---|---|
Content Understanding は動画ファイルからシーン分割 / 字幕生成 / ハイライト抽出を行え、スポーツや会議録画の自動編集にも活用できる。 Foundry の Content Understanding は動画モダリティを正規サポートし、シーン分析 / メタデータ抽出 / ハイライト生成を提供します。 | ||
音声 / 動画 からの information extraction は不可能で、テキストと画像のみが extraction の対象である。 AI-901 Skills Outline では音声 / 動画 を含む 4 モダリティすべてが information extraction の対象とされ、Content Understanding が対応します。 | ||
speech-to-text の出力に speaker diarization を組み合わせると、議事録から「誰がいつ何を発言したか」を構造化された形で取り出せる。 Azure AI Speech の話者分離と STT を組み合わせるのが議事録自動化の標準パターンで、Foundry SDK から統合できます。 |
解説
【正解一覧】
| ステートメント | 正解 |
|---|---|
| Content Understanding は動画ファイルからシーン分割 / 字幕生成 / ハイライト抽出を行え、スポーツや会議録画の自… | はい |
| 音声 / 動画 からの information extraction は不可能で、テキストと画像のみが extraction の対象である。 | いいえ |
| speech-to-text の出力に speaker diarization を組み合わせると、議事録から「誰がいつ何を発言したか」を… | はい |
【各判定の詳細】
- 「Content Understanding は動画ファイルからシーン分割 / 字幕生成 / ハイ…」→ はい: Foundry の Content Understanding は動画モダリティを正規サポートし、シーン分析 / メタデータ抽出 / ハイライト生成を提供します。
- 「音声 / 動画 からの information extraction は不可能で、テキストと画像…」→ いいえ: AI-901 Skills Outline では音声 / 動画 を含む 4 モダリティすべてが information extraction の対象とされ、Content Understanding が対応します。
- 「speech-to-text の出力に speaker diarization を組み合わせると…」→ はい: Azure AI Speech の話者分離と STT を組み合わせるのが議事録自動化の標準パターンで、Foundry SDK から統合できます。

コメント