AI901-Concept#4
Azure AI Foundry のプロジェクトで Fairness を定量評価するアプローチとして最も適切なものはどれですか?
解説
【正解: B】の理由
Fairness の評価は、全体精度だけでは不十分で、性別 / 年齢 / 地域などの属性グループ別の性能差を計測する必要があります。Fairlearn は selection rate や false positive rate などをグループ別に比較できる OSS ツールで、Azure AI Foundry の Responsible AI dashboard / scorecard と統合されています。
【他選択肢が違う理由】
Fairness の評価は、全体精度だけでは不十分で、性別 / 年齢 / 地域などの属性グループ別の性能差を計測する必要があります。Fairlearn は selection rate や false positive rate などをグループ別に比較できる OSS ツールで、Azure AI Foundry の Responsible AI dashboard / scorecard と統合されています。
【他選択肢が違う理由】
- A: 全体精度が高くても特定グループに対し低性能となる可能性があり、不十分です。
- C: API レイヤーの可用性指標で、Fairness とは無関係です。
- D: プロンプト長は出力品質の話で、公平性評価ではありません。

コメント