WEB問題集
AI901-Concept#1
Microsoft の Responsible AI フレームワークが規定する 6 つの中核原則の組み合わせとして、正しいものを 1 つ選んでください。
解説
【正解: A】の理由
Microsoft の Responsible AI Standard は、Fairness (公平性) / Reliability and safety (信頼性と安全性) / Privacy and security (プライバシーとセキュリティ) / Inclusiveness (包括性) / Transparency (透明性) / Accountability (説明責任) の 6 原則を定義しています。Azure AI Foundry での開発・運用も、この 6 原則に沿った設計判断が求められます。
【他選択肢が違う理由】
Microsoft の Responsible AI Standard は、Fairness (公平性) / Reliability and safety (信頼性と安全性) / Privacy and security (プライバシーとセキュリティ) / Inclusiveness (包括性) / Transparency (透明性) / Accountability (説明責任) の 6 原則を定義しています。Azure AI Foundry での開発・運用も、この 6 原則に沿った設計判断が求められます。
【他選択肢が違う理由】
- B: 性能 / コスト系の指標であり、Responsible AI 原則ではありません。
- C: 機械学習モデルの評価指標であり、原則とは異なる概念です。
- D: ISO/IEC 25010 ソフトウェア品質特性であり、AI 倫理原則ではありません。
AI901-Concept#2
Responsible AI の Fairness (公平性) 原則の目的を最も的確に表しているものはどれですか?
解説
【正解: B】の理由
Fairness 原則は、AI システムが個人の属性に基づき不当な差別や不平等な扱いを生じさせないことを目的とします。具体的には、訓練データの代表性確保 / グループ別性能評価 / バイアス緩和ツール (Fairlearn) の活用が求められ、Azure AI Foundry の Responsible AI dashboard でも disparity 指標を継続的に監視できます。
【他選択肢が違う理由】
Fairness 原則は、AI システムが個人の属性に基づき不当な差別や不平等な扱いを生じさせないことを目的とします。具体的には、訓練データの代表性確保 / グループ別性能評価 / バイアス緩和ツール (Fairlearn) の活用が求められ、Azure AI Foundry の Responsible AI dashboard でも disparity 指標を継続的に監視できます。
【他選択肢が違う理由】
- A: パフォーマンスの均一化は信頼性の話で、公平性の中核ではありません。
- C: 開発コストの社内配分は組織運営の問題で、Responsible AI 原則ではありません。
- D: 料金体系のことであり、公平性原則の対象ではありません。
AI901-Concept#3
ある企業が採用候補者のスクリーニング AI を Azure AI Foundry で構築しています。過去 10 年の採用データで訓練したところ、特定の属性グループに対して採用率が著しく低い結果が出ました。原因として最も可能性が高いものはどれですか?
解説
【正解: C】の理由
機械学習モデルは訓練データから統計的パターンを学習するため、過去の人事判断に含まれる歴史的バイアスをそのまま再現してしまいます。これはデータ起源のバイアスと呼ばれ、Fairness で最も注意すべきリスクです。代表性のあるデータ収集 / 属性間性能評価 / Fairlearn 等での緩和が必要となります。
【他選択肢が違う理由】
機械学習モデルは訓練データから統計的パターンを学習するため、過去の人事判断に含まれる歴史的バイアスをそのまま再現してしまいます。これはデータ起源のバイアスと呼ばれ、Fairness で最も注意すべきリスクです。代表性のあるデータ収集 / 属性間性能評価 / Fairlearn 等での緩和が必要となります。
【他選択肢が違う理由】
- A: デプロイ設定の誤りは可用性問題で、特定グループへの偏向結果は生じません。
- B: レイテンシは速度の問題で、判定結果のバイアスとは無関係です。
- D: クォータ制限は処理停止を起こすだけで、バイアスは生まれません。
- E: 認証エラーであり、バイアスとは無関係です。
AI901-Concept#4
Azure AI Foundry のプロジェクトで Fairness を定量評価するアプローチとして最も適切なものはどれですか?
解説
【正解: B】の理由
Fairness の評価は、全体精度だけでは不十分で、性別 / 年齢 / 地域などの属性グループ別の性能差を計測する必要があります。Fairlearn は selection rate や false positive rate などをグループ別に比較できる OSS ツールで、Azure AI Foundry の Responsible AI dashboard / scorecard と統合されています。
【他選択肢が違う理由】
Fairness の評価は、全体精度だけでは不十分で、性別 / 年齢 / 地域などの属性グループ別の性能差を計測する必要があります。Fairlearn は selection rate や false positive rate などをグループ別に比較できる OSS ツールで、Azure AI Foundry の Responsible AI dashboard / scorecard と統合されています。
【他選択肢が違う理由】
- A: 全体精度が高くても特定グループに対し低性能となる可能性があり、不十分です。
- C: API レイヤーの可用性指標で、Fairness とは無関係です。
- D: プロンプト長は出力品質の話で、公平性評価ではありません。
AI901-Concept#5
AI モデルの Fairness を改善する手法として適切なものを 2 つ選択してください。
2 つ選択してください
解説
【正解: A, C】の理由
Fairness 改善はデータ層 (代表性の確保) と学習層 (緩和アルゴリズム) の両方で行います。A は不均衡なデータセットでマイノリティ クラスを増強するデータ層の対策、C は Fairlearn の ExponentiatedGradient や ThresholdOptimizer 等で学習・後処理層の disparity を直接緩和する対策で、両者を組み合わせるのが推奨アプローチです。
【他選択肢が違う理由】
Fairness 改善はデータ層 (代表性の確保) と学習層 (緩和アルゴリズム) の両方で行います。A は不均衡なデータセットでマイノリティ クラスを増強するデータ層の対策、C は Fairlearn の ExponentiatedGradient や ThresholdOptimizer 等で学習・後処理層の disparity を直接緩和する対策で、両者を組み合わせるのが推奨アプローチです。
【他選択肢が違う理由】
- B: 全体精度向上は公平性に寄与せず、特定グループの精度が下がる可能性すらあります。
- D: API パフォーマンスの話で、Fairness とは無関係です。
- E: プロンプト長は出力スタイルの話で、公平性とは無関係です。
AI901-Concept#6-1
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある銀行が、住宅ローン審査を支援する AI モデルを Azure AI Foundry で開発しています。過去 5 年分の審査履歴で訓練しましたが、地域別および年齢層別に承認率の偏りがある可能性が指摘されました。Fairness 原則に沿って、デプロイ前にバイアスを評価・緩和する必要があります。
解決策
Responsible AI dashboard を使用し、地域および年齢層のグループごとに承認率 (selection rate) と false positive rate を計測して、グループ間の disparity 指標が許容範囲内かを検証します。
この解決策は目的を満たしますか?
解説
【判定: はい】の理由
Responsible AI dashboard はモデルの性能をセンシティブ属性 (地域 / 年齢層など) のグループ別に分解して可視化する標準ツールであり、selection rate / false positive rate / accuracy の disparity を一目で確認できます。Fairlearn ライブラリと統合され、Azure AI Foundry のプロジェクトから直接呼び出せます。グループ間の差を定量化することで、Fairness 評価の第一歩として適切に機能し、その後の緩和策 (データ補強 / 再重み付け / ThresholdOptimizer 等) の必要性判断にも繋がります。
【「いいえ」が違う理由】
本解決策はグループ別性能の計測という Fairness 評価の根幹に直接対応しており、Microsoft が公式に推奨する Responsible AI dashboard を活用しています。デプロイ前のバイアス検出という目的に完全に合致するため、「いいえ」と判定する根拠はありません。
Responsible AI dashboard はモデルの性能をセンシティブ属性 (地域 / 年齢層など) のグループ別に分解して可視化する標準ツールであり、selection rate / false positive rate / accuracy の disparity を一目で確認できます。Fairlearn ライブラリと統合され、Azure AI Foundry のプロジェクトから直接呼び出せます。グループ間の差を定量化することで、Fairness 評価の第一歩として適切に機能し、その後の緩和策 (データ補強 / 再重み付け / ThresholdOptimizer 等) の必要性判断にも繋がります。
【「いいえ」が違う理由】
本解決策はグループ別性能の計測という Fairness 評価の根幹に直接対応しており、Microsoft が公式に推奨する Responsible AI dashboard を活用しています。デプロイ前のバイアス検出という目的に完全に合致するため、「いいえ」と判定する根拠はありません。
AI901-Concept#6-2
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある銀行が、住宅ローン審査を支援する AI モデルを Azure AI Foundry で開発しています。過去 5 年分の審査履歴で訓練しましたが、地域別および年齢層別に承認率の偏りがある可能性が指摘されました。Fairness 原則に沿って、デプロイ前にバイアスを評価・緩和する必要があります。
解決策
訓練データから「地域」「年齢」のセンシティブ属性カラムを単純に削除して再訓練することで、モデルがそれらの属性に依存しないようにします。
この解決策は目的を満たしますか?
解説
【判定: いいえ】の理由
センシティブ属性カラムを削除しても、郵便番号 / 勤務先 / 取引履歴などの代替変数 (プロキシ変数) を通じてモデルが同じ偏向を学習してしまうため、バイアスは解消されません。これは「fairness through unawareness」と呼ばれる古典的な誤った緩和策で、Microsoft Responsible AI 公式ガイダンスでも非推奨とされています。正しいアプローチは、属性を保持して disparity を計測したうえで Fairlearn 等の緩和アルゴリズムや事後しきい値調整を組み合わせる方法です。
【「はい」が違う理由】
センシティブ属性の削除だけではプロキシ変数経由のバイアスを止められず、結果として地域や年齢層による不均衡が温存されます。むしろ削除により監査時にグループ別性能を再評価できなくなり、Accountability の観点でも不利になります。「目的を満たす」と判定するのは Fairness 評価・緩和の本質を見誤っており、「はい」は適切ではありません。
センシティブ属性カラムを削除しても、郵便番号 / 勤務先 / 取引履歴などの代替変数 (プロキシ変数) を通じてモデルが同じ偏向を学習してしまうため、バイアスは解消されません。これは「fairness through unawareness」と呼ばれる古典的な誤った緩和策で、Microsoft Responsible AI 公式ガイダンスでも非推奨とされています。正しいアプローチは、属性を保持して disparity を計測したうえで Fairlearn 等の緩和アルゴリズムや事後しきい値調整を組み合わせる方法です。
【「はい」が違う理由】
センシティブ属性の削除だけではプロキシ変数経由のバイアスを止められず、結果として地域や年齢層による不均衡が温存されます。むしろ削除により監査時にグループ別性能を再評価できなくなり、Accountability の観点でも不利になります。「目的を満たす」と判定するのは Fairness 評価・緩和の本質を見誤っており、「はい」は適切ではありません。
AI901-Concept#6-3
注: この問題は、同じ前提を持つ一連の問題の一部です。それぞれの問題には異なる解決策が提示されます。
前提
ある銀行が、住宅ローン審査を支援する AI モデルを Azure AI Foundry で開発しています。過去 5 年分の審査履歴で訓練しましたが、地域別および年齢層別に承認率の偏りがある可能性が指摘されました。Fairness 原則に沿って、デプロイ前にバイアスを評価・緩和する必要があります。
解決策
デプロイ後も Responsible AI scorecard を定期的に生成し、本番データのドリフトに伴う disparity の変化を継続的に監視して、しきい値を超えた場合に再評価と緩和を実施します。
この解決策は目的を満たしますか?
解説
【判定: はい】の理由
Fairness はデプロイ前の評価だけで終わらず、本番運用中もデータ分布のドリフトに伴って disparity が変化するため、継続的な監視が必須です。Responsible AI scorecard は Azure AI Foundry のプロジェクトから生成でき、グループ別性能 / 公平性指標 / 説明可能性などを定期的にスナップショットとして残せます。しきい値超過時の再評価フローを組み込むことで、長期にわたって Fairness を保証する運用が実現します。
【「いいえ」が違う理由】
継続監視と再評価ループは Microsoft Responsible AI Standard が推奨するベスト プラクティスで、本番運用中の品質維持に直結します。一度の事前評価だけでは新規申込者の属性分布変化や外的要因によるドリフトを捕捉できず、Fairness 保証の不完全さを生むため、「いいえ」と判断する根拠はありません。
Fairness はデプロイ前の評価だけで終わらず、本番運用中もデータ分布のドリフトに伴って disparity が変化するため、継続的な監視が必須です。Responsible AI scorecard は Azure AI Foundry のプロジェクトから生成でき、グループ別性能 / 公平性指標 / 説明可能性などを定期的にスナップショットとして残せます。しきい値超過時の再評価フローを組み込むことで、長期にわたって Fairness を保証する運用が実現します。
【「いいえ」が違う理由】
継続監視と再評価ループは Microsoft Responsible AI Standard が推奨するベスト プラクティスで、本番運用中の品質維持に直結します。一度の事前評価だけでは新規申込者の属性分布変化や外的要因によるドリフトを捕捉できず、Fairness 保証の不完全さを生むため、「いいえ」と判断する根拠はありません。
AI901-Concept#7
以下の各ステートメントについて、Microsoft Responsible AI 6 原則の説明として正しい場合は「はい」を、正しくない場合は「いいえ」を選択してください。
注: 正解 1 つにつき 1 点が与えられます。
| ステートメント | はい | いいえ |
|---|---|---|
Fairness 原則は、AI システムが性別や年齢などの属性に基づき不当な差別を生じさせないことを目的とする。 Microsoft Responsible AI Standard における Fairness の定義そのものです。属性グループ間の不均衡な扱いを評価・緩和することが中核となります。 | ||
Reliability and safety 原則は、AI 推論のコストを最小化することを主な目的とする。 Reliability and safety はモデルが想定外入力でも安定動作し、誤動作時に安全停止できることを目的とします。コスト最小化は別軸の運用判断です。 | ||
Transparency 原則には、モデルの能力・限界・不確実性をユーザーに理解させる仕組みが含まれる。 Microsoft の transparency note やモデル カード、説明可能 AI の出力はすべて Transparency 原則の具体的な実装手段に該当します。 |
AI901-Concept#8
Microsoft Responsible AI Impact Assessment において推奨される評価ライフサイクルの正しい順序にステップを並べてください。
- AI システムの意図された用途とステークホルダーを特定する
- 想定される潜在的な被害 (harm) を特定し列挙する
- 特定された被害の発生確率と深刻度を測定する
- 緩和策を設計し、Responsible AI dashboard 等で効果を検証する
解説
【正しい順序】Identify intended use → Identify harms → Measure harms → Mitigate harms の流れです。最初にシステムの用途とステークホルダーを定義し (Identify use)、次にその用途下で起こりうる被害を網羅的に列挙し (Identify harms)、各被害について発生確率と深刻度を測定し (Measure)、最後に Fairlearn / Content Safety / 人間レビュー等の緩和策を実装します。順序を入れ替えると評価の網羅性や優先順位付けが破綻するため、この順番が Microsoft Responsible AI Impact Assessment の標準フローとして定められています。
