AIF-C01#106(fundamentals-ai-ml)
ある企業が、ペタバイト規模のラベル付けされていない顧客データを広告キャンペーンに利用したいと考えています。同社は、顧客を階層に分類し、自社製品を広告・プロモーションしたいとしています。 この要件を満たす方法論はどれですか?
正解:B
正解の根拠
教師なし学習はラベルなしデータからクラスタや潜在構造を発見する手法で、ペタバイト級のラベルなし顧客データから階層 (セグメント) を自動形成する用途に直接合致します。K-Means、階層クラスタリング、ガウス混合などが代表的で、SageMaker 組み込み K-Means や PCA で実装できます。
学習手法の比較
| 手法 | 必要データ |
|---|---|
| 教師なし | ラベルなしで構造発見 |
| 教師あり | ラベル付きデータ必須 |
| 強化学習 | 環境と報酬定義 |
| RLHF | 人間フィードバック |
不正解の理由
- A: 教師あり学習はラベル付きデータが必須で、ペタバイト規模のラベルなしデータの直接活用には適合しません。
- C: 強化学習は環境と報酬の設計が必要で、静的な顧客データの自動セグメンテーションとは設計目的が異なります。
- D: RLHF は人間フィードバックを基に LLM 出力を最適化する手法で、ラベルなし顧客分類用途には特化しすぎています。

コメント