AIF-C01#33(fundamentals-ai-ml)
ある企業が、心臓病のリスクを予測するための機械学習(ML)モデルを開発しています。このモデルは、年齢、コレステロール、血圧、喫煙状況、運動習慣などの患者データを使用します。データセットには、患者が心臓病であるかどうかを示すターゲット値(target value)が含まれています。 これらの要件を満たすML手法はどれですか?
正解:B
正解の根拠
各患者データに「心臓病であるか否か」のターゲット値が付与されているため、入力特徴量と正解ラベルのペアでモデルを学習させる教師あり学習が適切です。SageMaker XGBoost やロジスティック回帰など 2 値分類アルゴリズムを利用すれば、患者特徴から心臓病リスクを予測するモデルを構築できます。
学習タイプの違い
| 学習タイプ | 特徴 |
|---|---|
| 教師あり | ラベル付き、分類/回帰 |
| 教師なし | ラベル無し、構造発見 |
| 強化学習 | 報酬最大化 |
| 半教師あり | ラベル一部のみ |
不正解の理由
- A: 教師なし学習はラベル無しデータの構造抽出が目的で、明確なラベルを使う本問とは設計目的が異なります。
- C: 強化学習は環境とのインタラクションから方策を学ぶ手法で、静的な患者データの分類問題には適しません。
- D: 半教師あり学習は一部のみラベルがある状況向けで、全データにターゲット値がある本問の前提とは合いません。

コメント