AIF-C01#49(fundamentals-ai-ml)

ある企業が、特定のコンテンツ領域（分野）でAIアシスタントをトレーニングするために、大規模なデータセットを収集する必要があります。この要件を満たすデータセットはどれですか？

A. 関連する専門用語が含まれている、多様な会話データ
B. 汎用的な過去の売上の時系列データ
C. ニュース記事の感情分析データ
D. ユニークな製品IDと、対応するユーザーID

正解：A

正解の根拠

特定のコンテンツ領域で AI アシスタントを訓練するには、その領域の専門用語と多様な対話パターンを含む会話データセットが最適です。LLM のドメイン適応 (Continued Pre-training や Fine-tuning) でドメイン語彙と回答スタイルを学習させ、Bedrock のカスタムモデルや SageMaker JumpStart で実装できます。

データセット適合性

データ種別	適合性
専門用語含む対話	ドメイン特化アシスタントに最適
売上時系列	需要予測向け
感情分析データ	感情判定向け
商品/ユーザー ID	レコメンド向け

不正解の理由

B: 売上時系列はトレンド予測に向いた数値データで、専門ドメイン会話を学ぶ訓練データとしては不適切です。
C: ニュース感情分析データは極性ラベル付きで、対話型アシスタントの会話学習用途には合致しません。
D: 製品/ユーザー ID のペアは協調フィルタリング向けで、ドメイン特化対話の学習源にはなり得ません。

参考：Bedrock カスタムモデル

AIF-C01#49(fundamentals-ai-ml)

正解の根拠

データセット適合性

不正解の理由

コメント

コメント

コメントするコメントをキャンセル

正解の根拠

データセット適合性

不正解の理由

コメント

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル