AIF-C01#89(fundamentals-ai-ml)

AIF-C01#89(fundamentals-ai-ml)
ある企業が、視覚障害を持つユーザー向けのモバイルアプリを開発しています。 このアプリは、ユーザーの発話を認識し、音声で応答を提供できる必要があります。 この要件を満たすソリューションはどれですか?

正解:A

正解の根拠

視覚障害者向けに発話を認識し音声で応答するアプリは、音声認識 (ASR) と音声合成 (TTS) を組み合わせた処理を必要とします。音声認識には Recurrent Neural Network や Transformer ベースのディープラーニングニューラルネットワークが用いられ、Amazon Transcribe (ASR) と Polly (TTS) の組合せ、または Lex を使った会話型ボットで実装できます。

関連手法の用途

手法用途
ディープラーニング ASR音声→テキスト認識
数値パターン ML需要予測・分類
生成 AI 要約テキスト要約生成
画像認識視覚物体識別

不正解の理由

  • B: 数値データのパターン検出は需要予測や金融分析向けで、音声入出力の対話アプリの実現手段にはなりません。
  • C: 生成 AI 要約は文書テキストを短くまとめる用途で、ユーザー発話の認識を主目的とするものではありません。
  • D: 画像分類は視覚的物体識別の手法で、音声を扱うアクセシビリティアプリの中核機能ではありません。

参考:Amazon Transcribe


コメント

コメント

コメントする

目次