AIF-C01#21(fundamentals-ai-ml)
ある企業が、データベースエラーによっていくつかの単語が欠落しているドキュメントを保有しています。この企業は、欠落しているテキストに適した単語を提案できる機械学習(ML)モデルを構築したいと考えています。 この要件を満たすモデルの種類はどれですか?
正解:D
正解の根拠
BERT (Bidirectional Encoder Representations from Transformers) は双方向の文脈を考慮した言語モデルで、文中の欠落単語予測 (Masked Language Modeling) を事前学習タスクとしています。穴埋めや欠落単語推定にそのまま適用でき、SageMaker JumpStart や Hugging Face モデルで利用可能です。
テキスト系モデルの用途
| モデル | 用途 |
|---|---|
| BERT | 穴埋め/分類/QA |
| トピックモデル | 文書のトピック抽出 |
| クラスタリング | 類似グループ化 |
| 規範 ML | 意思決定推奨 |
不正解の理由
- A: トピックモデリングは文書集合からトピック分布を推定する手法で、特定の欠落単語を予測する用途には合致しません。
- B: クラスタリングは類似サンプルを群にまとめる手法で、欠落語句を文脈的に補う機能を提供しません。
- C: 規範 ML (prescriptive) は意思決定推奨を目的とした手法群で、欠落単語の言語モデリングとは目的が異なります。

コメント