AI901-Foundry#118-1
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある教育系企業が、英語学習教材の朗読音声を Azure TTS で量産したいと考えています。要件は (1) 米国アクセント (en-US) と英国アクセント (en-GB) を学習レベルごとに切り替え、(2) ナレーション中に重要語を強調・若干スロー読み、(3) 数字や日付を「2025 / 10 / 31」ではなく「October thirty first, twenty twenty five」と人が話す形式で読み上げ、(4) 月 1,000 本の音声ファイル (mp3) を品質一定で生成する、です。
解決策
SSML を採用し、<voice> で en-US-JennyNeural と en-GB-LibbyNeural を切り替え、<emphasis><prosody rate="-10%"> で重要語を強調・スロー読み、<say-as interpret-as="date"> で日付を自然な読み上げ形式に整形し、SpeechSynthesizer の SpeakSsmlAsync をバッチ実行して mp3 を Blob に保存します。
この解決策は目的を満たしますか?
ディスカッション 0

コメント

コメントする

目次