AI901-Foundry#123 | CloudCamp｜クラウド資格のWEB問題集

AI901-Foundry#123

Custom Neural Voice を訓練する際、Microsoft が必要とするデータの要件として最も適切なものはどれですか?

A. 公開されている任意の音声 (例: ニュースキャスター / 著名人) をスクレイピングして数千時間集めれば十分 B. 発話者の同意取得・本人確認を経た上で、ターゲット voice を担当する声優の高品質スタジオ録音とその書き起こしテキスト (対訳) のペア、推奨数百〜数千文を Speech Studio / Foundry の Custom Voice にアップロードする C. 1 文だけ録音すれば自動的にあらゆる発話パターンを補完して訓練が完了する D. 音声データは不要で、テキストデータのみで CNV を訓練できる

ディスカッション 0

解説

コメント

コメントするコメントをキャンセル

解説

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル