AI901-Foundry#118-1

注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。

前提

ある教育系企業が、英語学習教材の朗読音声を Azure TTS で量産したいと考えています。要件は (1) 米国アクセント (en-US) と英国アクセント (en-GB) を学習レベルごとに切り替え、(2) ナレーション中に重要語を強調・若干スロー読み、(3) 数字や日付を「2025 / 10 / 31」ではなく「October thirty first, twenty twenty five」と人が話す形式で読み上げ、(4) 月 1,000 本の音声ファイル (mp3) を品質一定で生成する、です。

解決策

SSML を採用し、<voice> で en-US-JennyNeural と en-GB-LibbyNeural を切り替え、<emphasis> と <prosody rate="-10%"> で重要語を強調・スロー読み、<say-as interpret-as="date"> で日付を自然な読み上げ形式に整形し、SpeechSynthesizer の SpeakSsmlAsync をバッチ実行して mp3 を Blob に保存します。

この解決策は目的を満たしますか?

A.はい B.いいえ

ディスカッション 0

解説

コメント

コメントするコメントをキャンセル

解説

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル