AI901-Foundry#112
以下の各ステートメントについて、Azure AI Speech の Speech-to-Text の説明として正しい場合は「はい」を、正しくない場合は「いいえ」を選択してください。
注: 正解 1 つにつき 1 点が与えられます。
| ステートメント | はい | いいえ |
|---|---|---|
Speech-to-Text はリアルタイム認識 (low latency) と batch 認識 (大量ファイル非同期) の両方を提供する。 Microsoft Learn の STT documentation に列挙される 2 つの主要モードで、ユース ケースで使い分けます。 | ||
Custom Speech は業界用語や訛り・雑音環境に特化したカスタム認識モデルを訓練するための公式機能である。 Speech Studio で対訳 / 専門用語データから訓練でき、endpoint ID で運用に組み込めます。 | ||
Speech-to-Text は対応言語が英語 1 種類のみで、日本語や他言語の認識には別途 OSS が必要である。 多言語対応 (ja-JP / en-US / zh-CN 等を含む 100 以上) で、OSS への置き換えは不要です。 |
解説
【正解一覧】
| ステートメント | 正解 |
|---|---|
| Speech-to-Text はリアルタイム認識 | はい |
| Custom Speech は業界用語や訛り・雑音環境に特化したカスタム認識モデルを訓練するための公式機能である。 | はい |
| Speech-to-Text は対応言語が英語 1 種類のみで、日本語や他言語の認識には別途 OSS が必要である。 | いいえ |
【各判定の詳細】
- 「Speech-to-Text はリアルタイム認識」→ はい: Microsoft Learn の STT documentation に列挙される 2 つの主要モードで、ユース ケースで使い分けます。
- 「Custom Speech は業界用語や訛り・雑音環境に特化したカスタム認識モデルを訓練するため…」→ はい: Speech Studio で対訳 / 専門用語データから訓練でき、endpoint ID で運用に組み込めます。
- 「Speech-to-Text は対応言語が英語 1 種類のみで、日本語や他言語の認識には別途 O…」→ いいえ: 多言語対応 (ja-JP / en-US / zh-CN 等を含む 100 以上) で、OSS への置き換えは不要です。

コメント