AI901-Concept#136
次の各シナリオに最も適した Azure AI Speech の機能をドロップダウンから選択してください。同じ選択肢を 2 回以上使用できます。
| ステートメント | 選択 |
|---|---|
ライブ Webinar の音声から字幕をリアルタイムで生成して画面に表示する。 低レイテンシ要件はリアルタイム STT が最適です。WebSocket / SDK で逐次 partial result を受け取ります。 | |
1 年分の議事録音声 (数千件) を夜間に非同期で一括書き起こす。 大量音声の非同期処理は batch transcription が最適です。Storage Blob から直接処理できコスト効率が高くなります。 | |
医療用語が多い問診音声の認識精度を上げるため、専門語彙を事前に適応学習させる。 ドメイン特化の語彙適応は custom speech の役割で、汎用モデルでは認識率が下がる専門領域での精度を引き上げます。 |
解説
【正解マッチング】
| 判定対象 | 正解 |
|---|---|
| ライブ Webinar の音声から字幕をリアルタイムで生成して画面に表示する。 | real-time STT |
| 1 年分の議事録音声 | batch transcription |
| 医療用語が多い問診音声の認識精度を上げるため、専門語彙を事前に適応学習させる。 | custom speech |
【各判定の詳細】
- 「ライブ Webinar の音声から字幕をリアルタイムで生成して画面に表示する。」→ real-time STT: 低レイテンシ要件はリアルタイム STT が最適です。WebSocket / SDK で逐次 partial result を受け取ります。
- 「1 年分の議事録音声」→ batch transcription: 大量音声の非同期処理は batch transcription が最適です。Storage Blob から直接処理できコスト効率が高くなります。
- 「医療用語が多い問診音声の認識精度を上げるため、専門語彙を事前に適応学習させる。」→ custom speech: ドメイン特化の語彙適応は custom speech の役割で、汎用モデルでは認識率が下がる専門領域での精度を引き上げます。

コメント