AI901-Foundry#120
次の各ユース ケースに最も適した Azure TTS のボイス種別をドラッグしてください。
項目(ドラッグしてください)
- ブランド独自の声優風ナレーターを社内録音で訓練し、すべての音声コンテンツを自社ブランドの声で統一したい
- 教材コンテンツを 30 言語に展開し、各言語のネイティブ感のある標準ナレーションを最小コストで実現したい
- 1 つの SSML 内で「ナレーター」「キャラ A」「キャラ B」の声を切り替え、オーディオ ブックの対話シーンを表現したい
- 顧客窓口応答の音声を「お詫び時はやや低めで穏やか」「お礼時は明るく」など感情ニュアンスを切り替えて読み上げたい
Custom Neural Voice (自社訓練)
Prebuilt Neural Voice (多言語標準)
Prebuilt Neural Voice 複数 + SSML <voice> 切替
Prebuilt Neural Voice + SSML <mstts:express-as style>
解説
【正解】各ユース ケースは Azure TTS の以下ボイス種別が最適です。
- ブランド独自の声優風ナレーターを社内録音で訓練し、すべての音声コンテンツを自社ブランドの声で統一したい は Custom Neural Voice (自社訓練) で、Microsoft 公式の専用フローで対訳録音をアップロードして自社専用 voice を訓練・デプロイできます。
- 教材コンテンツを 30 言語に展開し、各言語のネイティブ感のある標準ナレーションを最小コストで実現したい は Prebuilt Neural Voice (多言語標準) で、各言語に複数の高品質 voice が用意済みなので追加訓練なしで広範な言語展開が可能です。
- 1 つの SSML 内で「ナレーター」「キャラ A」「キャラ B」の声を切り替え、オーディオ ブックの対話シーンを表現したい は Prebuilt Neural Voice 複数 + SSML <voice> 切替 で、
<voice>タグを入れ子に使うことで複数キャラの対話を 1 リクエストで生成できます。 - 顧客窓口応答の音声を「お詫び時はやや低めで穏やか」「お礼時は明るく」など感情ニュアンスを切り替えて読み上げたい は Prebuilt Neural Voice + SSML <mstts:express-as style> で、style 属性 (cheerful / empathetic / sad 等) を指定して感情表現を切り替えるのが Microsoft 推奨の正攻法です。

コメント