AI901-Foundry#113
Azure AI Speech の Text-to-Speech (TTS) 機能を最も的確に表す説明はどれですか?
解説
【正解: A】の理由
Azure AI Speech の Text-to-Speech は、入力テキストを人間に近い自然な音声波形 (mp3 / wav / ogg 等) に合成するサービスで、Microsoft が事前に学習した prebuilt neural voice (各言語に複数の標準ボイス) と、組織独自のブランド ボイスを訓練できる custom neural voice の 2 系統を提供します。Foundry hub から connection で繋ぐと、Foundry portal の Speech playground で即時試行が可能で、Speech SDK / REST API から本番アプリへ統合できます。
【他選択肢が違う理由】
Azure AI Speech の Text-to-Speech は、入力テキストを人間に近い自然な音声波形 (mp3 / wav / ogg 等) に合成するサービスで、Microsoft が事前に学習した prebuilt neural voice (各言語に複数の標準ボイス) と、組織独自のブランド ボイスを訓練できる custom neural voice の 2 系統を提供します。Foundry hub から connection で繋ぐと、Foundry portal の Speech playground で即時試行が可能で、Speech SDK / REST API から本番アプリへ統合できます。
【他選択肢が違う理由】
- B: 話者特定は Speaker Recognition の別機能で、TTS の合成方向とは逆です。
- C: VLAN 構成は Networking の領域です。
- D: Storage のファイル変換とは別概念です。

コメント