AIF-C01#89(fundamentals-ai-ml)

ある企業が、視覚障害を持つユーザー向けのモバイルアプリを開発しています。このアプリは、ユーザーの発話を認識し、音声で応答を提供できる必要があります。この要件を満たすソリューションはどれですか？

A. ディープラーニングニューラルネットワークを使用して音声認識を行う。
B. 数値データのパターンを検索するための機械学習モデルを構築する。
C. 生成AIの要約機能を使用して、人間らしいテキストを生成する。
D. 画像分類および認識のためのカスタムモデルを構築する。

正解：A

正解の根拠

視覚障害者向けに発話を認識し音声で応答するアプリは、音声認識 (ASR) と音声合成 (TTS) を組み合わせた処理を必要とします。音声認識には Recurrent Neural Network や Transformer ベースのディープラーニングニューラルネットワークが用いられ、Amazon Transcribe (ASR) と Polly (TTS) の組合せ、または Lex を使った会話型ボットで実装できます。

手法	用途
ディープラーニング ASR	音声→テキスト認識
数値パターン ML	需要予測・分類
生成 AI 要約	テキスト要約生成
画像認識	視覚物体識別

不正解の理由

B: 数値データのパターン検出は需要予測や金融分析向けで、音声入出力の対話アプリの実現手段にはなりません。
C: 生成 AI 要約は文書テキストを短くまとめる用途で、ユーザー発話の認識を主目的とするものではありません。
D: 画像分類は視覚的物体識別の手法で、音声を扱うアクセシビリティアプリの中核機能ではありません。

参考：Amazon Transcribe

AIF-C01#89(fundamentals-ai-ml)

正解の根拠

関連手法の用途

不正解の理由

コメント

コメント

コメントするコメントをキャンセル

正解の根拠

関連手法の用途

不正解の理由

コメント

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル