AIF-C01#49(fundamentals-ai-ml)

AIF-C01#49(fundamentals-ai-ml)
ある企業が、特定のコンテンツ領域(分野)でAIアシスタントをトレーニングするために、大規模なデータセットを収集する必要があります。 この要件を満たすデータセットはどれですか?

正解:A

正解の根拠

特定のコンテンツ領域で AI アシスタントを訓練するには、その領域の専門用語と多様な対話パターンを含む会話データセットが最適です。LLM のドメイン適応 (Continued Pre-training や Fine-tuning) でドメイン語彙と回答スタイルを学習させ、Bedrock のカスタムモデルや SageMaker JumpStart で実装できます。

データセット適合性

データ種別適合性
専門用語含む対話ドメイン特化アシスタントに最適
売上時系列需要予測向け
感情分析データ感情判定向け
商品/ユーザー IDレコメンド向け

不正解の理由

  • B: 売上時系列はトレンド予測に向いた数値データで、専門ドメイン会話を学ぶ訓練データとしては不適切です。
  • C: ニュース感情分析データは極性ラベル付きで、対話型アシスタントの会話学習用途には合致しません。
  • D: 製品/ユーザー ID のペアは協調フィルタリング向けで、ドメイン特化対話の学習源にはなり得ません。

参考:Bedrock カスタムモデル


コメント

コメント

コメントする

目次