AI901-Foundry#118-2
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある教育系企業が、英語学習教材の朗読音声を Azure TTS で量産したいと考えています。要件は (1) 米国アクセント (en-US) と英国アクセント (en-GB) を学習レベルごとに切り替え、(2) ナレーション中に重要語を強調・若干スロー読み、(3) 数字や日付を「2025 / 10 / 31」ではなく「October thirty first, twenty twenty five」と人が話す形式で読み上げ、(4) 月 1,000 本の音声ファイル (mp3) を品質一定で生成する、です。
解決策
SSML をまったく使わず、すべての要件をプレーン テキストで TTS に渡します。アクセント切替は en-US 固定の voice 1 種類で代用し、強調・スロー読み・日付の読み上げ形式はすべて TTS の自動推論に任せ、エンドポイントから返ってきた mp3 を Blob に保存します。
この解決策は目的を満たしますか?
ディスカッション 0

コメント

コメントする

目次