AI901-Concept#6-1
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある銀行が、住宅ローン審査を支援する AI モデルを Azure AI Foundry で開発しています。過去 5 年分の審査履歴で訓練しましたが、地域別および年齢層別に承認率の偏りがある可能性が指摘されました。Fairness 原則に沿って、デプロイ前にバイアスを評価・緩和する必要があります。
解決策
Responsible AI dashboard を使用し、地域および年齢層のグループごとに承認率 (selection rate) と false positive rate を計測して、グループ間の disparity 指標が許容範囲内かを検証します。
この解決策は目的を満たしますか?
解説
【判定: はい】の理由
Responsible AI dashboard はモデルの性能をセンシティブ属性 (地域 / 年齢層など) のグループ別に分解して可視化する標準ツールであり、selection rate / false positive rate / accuracy の disparity を一目で確認できます。Fairlearn ライブラリと統合され、Azure AI Foundry のプロジェクトから直接呼び出せます。グループ間の差を定量化することで、Fairness 評価の第一歩として適切に機能し、その後の緩和策 (データ補強 / 再重み付け / ThresholdOptimizer 等) の必要性判断にも繋がります。
【「いいえ」が違う理由】
本解決策はグループ別性能の計測という Fairness 評価の根幹に直接対応しており、Microsoft が公式に推奨する Responsible AI dashboard を活用しています。デプロイ前のバイアス検出という目的に完全に合致するため、「いいえ」と判定する根拠はありません。
Responsible AI dashboard はモデルの性能をセンシティブ属性 (地域 / 年齢層など) のグループ別に分解して可視化する標準ツールであり、selection rate / false positive rate / accuracy の disparity を一目で確認できます。Fairlearn ライブラリと統合され、Azure AI Foundry のプロジェクトから直接呼び出せます。グループ間の差を定量化することで、Fairness 評価の第一歩として適切に機能し、その後の緩和策 (データ補強 / 再重み付け / ThresholdOptimizer 等) の必要性判断にも繋がります。
【「いいえ」が違う理由】
本解決策はグループ別性能の計測という Fairness 評価の根幹に直接対応しており、Microsoft が公式に推奨する Responsible AI dashboard を活用しています。デプロイ前のバイアス検出という目的に完全に合致するため、「いいえ」と判定する根拠はありません。

コメント