AIF-C01#18(responsible-ai)
ある企業は、AI を活用した履歴書スクリーニングシステムを構築しました。企業は大規模なデータセットを使用してモデルをトレーニングしましたが、そのデータセットにはすべての人口統計学的グループを代表する履歴書が含まれていませんでした。このシナリオが提示する責任ある AI のコアディメンションはどれですか?
正解:A
正解の根拠
履歴書スクリーニングのような採用 AI で訓練データに特定の人口統計学的グループが十分含まれていない場合、モデルはその過小代表グループに対し体系的に不利な予測を出力する Sampling Bias を生じます。これは AWS 責任ある AI の公平性 (Fairness) 原則が直接対象とする問題で、SageMaker Clarify で CI や DPL などの指標を用いてグループ間バランスを評価する必要があります。
責任ある AI の 4 原則
| 原則 | 内容 |
|---|---|
| Fairness | 差別的影響の回避 |
| Explainability | 判断根拠の説明 |
| Privacy/Security | 個人情報の保護 |
| Transparency | モデル情報の開示 |
不正解の理由
- B: 説明可能性は予測理由を SHAP 等で示す原則で、訓練データの代表性不足を直接の対象とする原則ではありません。
- C: プライバシーとセキュリティは個人情報保護に関する原則で、グループ代表性の偏りを扱う公平性とは焦点が異なります。
- D: 透明性はモデル情報を開示する原則で、訓練データの代表性確保自体は公平性原則の役割です。

コメント