AI901-Foundry#125
Azure Speech SDK を使い、英語スピーチをリアルタイムに日本語へ同時通訳するアプリを実装する際、最も適切な実装パターンはどれですか?
解説
【正解: C】の理由
【他選択肢が違う理由】
TranslationRecognizer は Azure Speech SDK が同時通訳ユース ケース向けに提供する専用クラスで、内部で STT と Translator が統合されており、1 つのストリームから「source 言語 transcript」と「target 言語 transcript」を同時に取得できます。SpeechTranslationConfig で source / target 言語を指定し、StartContinuousRecognitionAsync を呼ぶことでリアルタイム認識と翻訳が並行実行され、コール バック (Recognized / Recognizing) でテキストを受け取れます。さらに Synthesizing イベントで合成音声まで一気通貫で生成することも可能で、同時通訳アプリの実装が大幅に簡素化されます。【他選択肢が違う理由】
- A: 2 段呼び出しも可能ですが TranslationRecognizer のほうが標準・効率的です。
- B: 手動操作はリアルタイム同時通訳の本旨に反します。
- D: GPT-4o は同時通訳の専用 API ではありません。

コメント