基礎・機械学習

SHAPとは?シャープレイ値・特徴寄与の説明

読み:しゃっぷ / 英:SHAP(SHapley Additive exPlanations)

更新日: 読了目安:約7分

SHAPは、予測結果に対して各特徴量がどれだけ寄与したかを、ゲーム理論のシャープレイ値(Shapley value)に基づいて配分する説明可能AI(XAI)手法です。本記事は厳密な数理導出ではなく、試験での識別とLIMEとの対比に焦点を当てます。

試験で問われる見方

G-398では、「特徴量の寄与度をゲーム理論的に評価する」=SHAPです(G-398)。LIMEとの役割分担を問う典型問題です。

XAIの目的全体はG-397のとおり、判断根拠の理解と信頼性・説明責任の向上です。

演習で確認する

G検定:G-398G-397TF-442

SHAPとは

SHAP(SHapley Additive exPlanations)は、予測値とベースライン(平均的な予測など)の差を、特徴ごとの寄与の和として分解する枠組みです。正の寄与は予測を押し上げ、負の寄与は押し下げる、と読みます。

実務ではサマリープロットなどで「どの特徴が全体的に効いているか」を可視化する用途も多いです。

シャープレイ値のイメージ

シャープレイ値は、複数の参加者が協力して得た成果を公平に配分する考え方です。SHAPでは「参加者=特徴量」、「成果=予測との差」と対応づけます。

試験では数式より「ゲーム理論」「寄与の配分」というラベルでLIMEと区別できれば十分です。

LIMEとの違い

LIMESHAP
核となる考え局所線形近似シャープレイ値
G-398の説明局所的に単純モデル寄与度をゲーム理論的に評価
理論的基盤近似・サンプリング公理に基づく配分

結果の読み方

  • 特徴のSHAP値が大きい — その予測への影響が大きい
  • 符号 — 正なら予測を上げる方向、負なら下げる方向
  • 全体サマリー — データセット横断の重要特徴の把握
  • 人の確認 — 寄与が直感と合うか、ドメイン知識で検証

すり替えに注意

誤った説明正しい理解
SHAP=LIMEシャープレイ値 vs 局所近似(G-398
SHAP=word2vecG-398の誤答パターン(埋め込み学習)
SHAP値が高い=特徴が常に重要文脈・インスタンスにより変わりうる
SHAPで説明=予測が正しい説明と正確性は別問題

よくある質問

SHAPは計算コストが高い?

厳密計算は高くなりうるため、近似アルゴリズムが使われます。試験ではコストより概念の識別が中心です。

公平性(Fairness)の公平と同じ?

別概念です。SHAPの「公平」は寄与配分の公理、AI倫理の公平性は差別・偏りの回避を指します。

TreeSHAPなど派生は?

木モデル向けの高速化などがあります。G検定ではSHAP/LIMEの対比が優先です。