AI901-Foundry#130
本番運用中の Azure AI Speech-to-Text コール センター文字起こしで、「業界専門用語 (例: 製品名・薬剤名) の誤認識率が高い」という苦情が増えました。Microsoft が推奨する第一の対処として、最も適切なものはどれですか?
解説
【正解: D】の理由
業界専門用語の誤認識は汎用 STT モデルの語彙範囲外に語が存在することで起こる典型的な問題で、Microsoft が公式に推奨する対処は Custom Speech によるドメイン特化訓練です。Speech Studio / Foundry の Custom Speech ワークフローに「実通話録音 + 書き起こし対訳」「専門用語辞書」をアップロードしてカスタム モデルを訓練し、endpoint ID を batch transcription / リアルタイム認識のジョブに指定すれば、業界用語の認識精度を大幅に底上げできます。Microsoft Learn の STT 品質チューニング ガイドの中核機能で、コール センター / 医療 / 製造現場で広く採用されます。
【他選択肢が違う理由】
業界専門用語の誤認識は汎用 STT モデルの語彙範囲外に語が存在することで起こる典型的な問題で、Microsoft が公式に推奨する対処は Custom Speech によるドメイン特化訓練です。Speech Studio / Foundry の Custom Speech ワークフローに「実通話録音 + 書き起こし対訳」「専門用語辞書」をアップロードしてカスタム モデルを訓練し、endpoint ID を batch transcription / リアルタイム認識のジョブに指定すれば、業界用語の認識精度を大幅に底上げできます。Microsoft Learn の STT 品質チューニング ガイドの中核機能で、コール センター / 医療 / 製造現場で広く採用されます。
【他選択肢が違う理由】
- A: リージョン切替は語彙範囲を変えないため誤認識率改善には寄与しません。
- B: 課金プラン変更も認識精度には無関係です。
- C: SSML は TTS の話で、STT 認識精度には影響しません。

コメント