AI901-Foundry#119
以下の各ステートメントについて、Azure TTS と SSML の説明として正しい場合は「はい」を、正しくない場合は「いいえ」を選択してください。
注: 正解 1 つにつき 1 点が与えられます。
| ステートメント | はい | いいえ |
|---|---|---|
SSML の <voice> タグは、内側の発話範囲だけ特定の neural voice (例: ja-JP-NanamiNeural) に切り替えるための公式タグである。Microsoft Learn の SSML reference に明記される標準機能で、複数 voice の対話シナリオも実装できます。 | ||
SSML を使わず TTS にプレーン テキストを渡すと、速度・ピッチ・強調・ポーズなどの細かい発話制御は SDK 引数からも一切できない。 プレーン テキスト時の制御は限定的ですが、SSML のほうが Microsoft 公式の推奨制御手段で、本格的な制御には SSML が必要です。 | ||
SpeechSynthesizer は SpeakTextAsync (プレーン テキスト) と SpeakSsmlAsync (SSML) の 2 系統の API を提供する。 Speech SDK の標準クラスとして両 API が用意され、用途に応じて選択します。 |
解説
【正解一覧】
| ステートメント | 正解 |
|---|---|
| SSML の ` ` タグは、内側の発話範囲だけ特定の neural voice | はい |
| SSML を使わず TTS にプレーン テキストを渡すと、速度・ピッチ・強調・ポーズなどの細かい発話制御は SDK 引数からも一切できない。 | いいえ |
| SpeechSynthesizer は SpeakTextAsync | はい |
【各判定の詳細】
- 「SSML の ` ` タグは、内側の発話範囲だけ特定の neural voice」→ はい: Microsoft Learn の SSML reference に明記される標準機能で、複数 voice の対話シナリオも実装できます。
- 「SSML を使わず TTS にプレーン テキストを渡すと、速度・ピッチ・強調・ポーズなどの細かい…」→ いいえ: プレーン テキスト時の制御は限定的ですが、SSML のほうが Microsoft 公式の推奨制御手段で、本格的な制御には SSML が必要です。
- 「SpeechSynthesizer は SpeakTextAsync」→ はい: Speech SDK の標準クラスとして両 API が用意され、用途に応じて選択します。

コメント