AI901-Foundry#115
SSML で日本語の特定の prebuilt neural voice (例: ja-JP-NanamiNeural) を指定するために使うタグとして、最も適切なものはどれですか?
解説
【正解: C】の理由
SSML の
【他選択肢が違う理由】
SSML の
<voice> タグは「name 属性に voice 名を指定し、内側の範囲だけその声で発話させる」標準タグです。Microsoft Learn の SSML reference に <voice name="ja-JP-NanamiNeural">こんにちは</voice> のように記載があり、1 つの SSML ドキュメント内で複数の <voice> を入れ子に使えば、複数キャラクターが対話するナレーションも 1 リクエストで合成できます。【他選択肢が違う理由】
- A:
<prosody>は速度 / ピッチ / ボリュームの調整で、声の選択ではありません。 - B:
<say-as>は数字 / 日付 / 電話番号などの読み方制御で、voice 選択用ではありません。 - D: SSML に voice 選択機能は明確に存在します。

コメント