AIF-C01#96(fundamentals-ai-ml)

AIF-C01#96(fundamentals-ai-ml)
ある企業がセキュリティカメラを設置しました。同社は、機械学習(ML)モデルを使用して、セキュリティカメラ映像を評価し、潜在的な盗難を検出しています。しかし、このモデルは特定の民族グループの人々を不均衡にフラグ付けしていることが判明しました。 このモデル出力に影響を与えているバイアスの種類はどれですか?

正解:B

正解の根拠

サンプリングバイアス (Sampling Bias) は訓練データが母集団全体を代表せず特定グループに偏って収集された場合に生じます。映像データに特定の民族グループが過多または過少に含まれると、モデルがそのグループを不均衡にフラグ付けする差別的予測を引き起こすため、本シナリオはサンプリングバイアスの典型例です。

主要なバイアスの種類

バイアス原因
サンプリングデータ収集の偏り
測定計測機器・方法の偏差
観察者アノテータの主観的差異
確証仮説に合うデータを優先

不正解の理由

  • A: 測定バイアスは計測手段や記録方式の系統誤差で、データ集合内のグループ代表性偏りとは原因が異なります。
  • C: 観察者バイアスはラベリング担当者の主観差で、本シナリオの母集団代表性問題とは発生メカニズムが異なります。
  • D: 確証バイアスは仮説に合致するデータを選好する認知バイアスで、訓練データの代表性偏りとは別の概念です。

参考:SageMaker Clarify バイアス検出


コメント

コメント

コメントする

目次