AIF-C01#112(fundamentals-ai-ml)
ある企業は、人間の遺伝子をその特性に基づいて20のカテゴリに分類したいと考えています。同社は、モデルの内部メカニズムが出力にどのように影響を与えるかを文書化するための機械学習(ML)アルゴリズムを必要としています。 この要件を満たすMLアルゴリズムはどれですか?
正解:A
正解の根拠
決定木 (Decision Tree) は条件分岐の階層構造によって分類を行うアルゴリズムであり、各ノードでどの特徴量がどう分岐に寄与しているかを可視化できるため、内部メカニズムが出力にどう影響するかを文書化しやすい代表的な解釈可能モデルです。SageMaker の XGBoost や Linear Learner と異なり木構造を直接図示でき、特徴量重要度も自然に得られます。SageMaker Clarify と組み合わせれば追加の説明性レポートも生成できます。
解釈性の比較
| アルゴリズム | 解釈性 |
|---|---|
| 決定木 | 高 (分岐を可視化) |
| 線形/ロジスティック回帰 | 中 (係数で説明) |
| ニューラルネット | 低 (ブラックボックス) |
不正解の理由
- B: 線形回帰は連続値を予測する回帰アルゴリズムで、20 カテゴリのような多クラス分類タスクには本来適合しません。
- C: ロジスティック回帰は確率を出力できますが本来は二値分類が基本であり、分岐ルールの可視化という観点では決定木に劣ります。
- D: ニューラルネットワークは高精度ですが内部の重みが多層で複雑なため、内部メカニズムの直接的な文書化には向きません。

コメント