AI901-Foundry#213
次の各音声情報抽出ユース ケースに最も適した Azure 上のアプローチをドラッグしてください。
項目(ドラッグしてください)
- Web 会議の長時間録音から「議論された議題 / 決定事項 / アクション項目 / 担当者」を構造化抽出して議事録に変換したい
- 1 万件の音声ファイルを単純に文字起こしして検索インデックスに登録するだけが目的
- コール センターで日本語 / 英語 / 中国語の混在録音を transcript + 業界用語認識精度で扱いたい
- コール センター録音の文字起こし結果から、顧客の氏名 / 電話番号 / クレジット カード番号を伏字化して社内分析に渡したい
Content Understanding の Audio analyzer (業務スキーマ抽出)
Azure AI Speech の Speech-to-Text (batch transcription)
Speech-to-Text + Custom Speech モデル (業界用語精度)
Speech-to-Text + Azure AI Language PII detection の組み合わせ
解説
【正解】各ユース ケースは以下のアプローチが最適です。
- Web 会議の長時間録音から「議論された議題 / 決定事項 / アクション項目 / 担当者」を構造化抽出して議事録に変換したい は Content Understanding の Audio analyzer (業務スキーマ抽出) で、analyzer スキーマで議事録フィールドを宣言的に定義するのが Microsoft 推奨パターンです。
- 1 万件の音声ファイルを単純に文字起こしして検索インデックスに登録するだけが目的 は Azure AI Speech の Speech-to-Text (batch transcription) で、構造化抽出が不要な純粋な transcription にはコスト効率の高い batch transcription が最適です。
- コール センターで日本語 / 英語 / 中国語の混在録音を transcript + 業界用語認識精度で扱いたい は Speech-to-Text + Custom Speech モデル (業界用語精度) で、業界用語の認識精度向上には Custom Speech の追加訓練が定石です。
- コール センター録音の文字起こし結果から、顧客の氏名 / 電話番号 / クレジット カード番号を伏字化して社内分析に渡したい は Speech-to-Text + Azure AI Language PII detection の組み合わせ で、Privacy and security 対応の標準パイプラインです。

コメント