AIF-C01#89(fundamentals-ai-ml)
ある企業が、視覚障害を持つユーザー向けのモバイルアプリを開発しています。 このアプリは、ユーザーの発話を認識し、音声で応答を提供できる必要があります。 この要件を満たすソリューションはどれですか?
正解:A
正解の根拠
視覚障害者向けに発話を認識し音声で応答するアプリは、音声認識 (ASR) と音声合成 (TTS) を組み合わせた処理を必要とします。音声認識には Recurrent Neural Network や Transformer ベースのディープラーニングニューラルネットワークが用いられ、Amazon Transcribe (ASR) と Polly (TTS) の組合せ、または Lex を使った会話型ボットで実装できます。
関連手法の用途
| 手法 | 用途 |
|---|---|
| ディープラーニング ASR | 音声→テキスト認識 |
| 数値パターン ML | 需要予測・分類 |
| 生成 AI 要約 | テキスト要約生成 |
| 画像認識 | 視覚物体識別 |
不正解の理由
- B: 数値データのパターン検出は需要予測や金融分析向けで、音声入出力の対話アプリの実現手段にはなりません。
- C: 生成 AI 要約は文書テキストを短くまとめる用途で、ユーザー発話の認識を主目的とするものではありません。
- D: 画像分類は視覚的物体識別の手法で、音声を扱うアクセシビリティアプリの中核機能ではありません。

コメント