SHAPは、予測結果に対して各特徴量がどれだけ寄与したかを、ゲーム理論のシャープレイ値(Shapley value)に基づいて配分する説明可能AI(XAI)手法です。本記事は厳密な数理導出ではなく、試験での識別とLIMEとの対比に焦点を当てます。
試験で問われる見方
G-398では、「特徴量の寄与度をゲーム理論的に評価する」=SHAPです(G-398)。LIMEとの役割分担を問う典型問題です。
XAIの目的全体はG-397のとおり、判断根拠の理解と信頼性・説明責任の向上です。
SHAPとは
SHAP(SHapley Additive exPlanations)は、予測値とベースライン(平均的な予測など)の差を、特徴ごとの寄与の和として分解する枠組みです。正の寄与は予測を押し上げ、負の寄与は押し下げる、と読みます。
実務ではサマリープロットなどで「どの特徴が全体的に効いているか」を可視化する用途も多いです。
シャープレイ値のイメージ
シャープレイ値は、複数の参加者が協力して得た成果を公平に配分する考え方です。SHAPでは「参加者=特徴量」、「成果=予測との差」と対応づけます。
試験では数式より「ゲーム理論」「寄与の配分」というラベルでLIMEと区別できれば十分です。
LIMEとの違い
| LIME | SHAP | |
|---|---|---|
| 核となる考え | 局所線形近似 | シャープレイ値 |
| G-398の説明 | 局所的に単純モデル | 寄与度をゲーム理論的に評価 |
| 理論的基盤 | 近似・サンプリング | 公理に基づく配分 |
結果の読み方
- 特徴のSHAP値が大きい — その予測への影響が大きい
- 符号 — 正なら予測を上げる方向、負なら下げる方向
- 全体サマリー — データセット横断の重要特徴の把握
- 人の確認 — 寄与が直感と合うか、ドメイン知識で検証
すり替えに注意
| 誤った説明 | 正しい理解 |
|---|---|
| SHAP=LIME | シャープレイ値 vs 局所近似(G-398) |
| SHAP=word2vec | G-398の誤答パターン(埋め込み学習) |
| SHAP値が高い=特徴が常に重要 | 文脈・インスタンスにより変わりうる |
| SHAPで説明=予測が正しい | 説明と正確性は別問題 |
よくある質問
SHAPは計算コストが高い?
厳密計算は高くなりうるため、近似アルゴリズムが使われます。試験ではコストより概念の識別が中心です。
公平性(Fairness)の公平と同じ?
別概念です。SHAPの「公平」は寄与配分の公理、AI倫理の公平性は差別・偏りの回避を指します。
TreeSHAPなど派生は?
木モデル向けの高速化などがあります。G検定ではSHAP/LIMEの対比が優先です。