適合率(Precision)は、モデルが「陽性」と予測したもののうち、実際に陽性だった割合です。本記事は公式の暗記だけでなく、試験で問われる混同行列の読み方・偽陽性との関係・再現率との使い分けに焦点を当てます。
試験で問われる見方
適合率は陽性予測の精度。偽陽性(誤検知)が問題になる場面で重要(G-056の混同行列文脈)。
混同行列
| 予測:陽性 | 予測:陰性 | |
|---|---|---|
| 実際:陽性 | 真陽性(TP) | 偽陰性(FN) |
| 実際:陰性 | 偽陽性(FP) | 真陰性(TN) |
適合率は予測が陽性だった列(TP+FP)のうち TP の割合です。
定義のイメージ
適合率 = TP ÷ (TP + FP)
「陽性と判定したもののうち、何割が本当に陽性か」を測ります。FP が多いと適合率は下がります。
重視する場面
誤検知のコストが高いときに適合率を重視します。例:迷惑メール判定で正常メールをスパムにしない、不正検知で善良ユーザーをブロックしない、など。
見逃しを減らしたい場合は再現率を重視(G-084)。
よくある質問
適合率と正解率は同じ?
違います。正解率は全体の正解割合、適合率は陽性予測に限定した指標です。
閾値を変えると?
分類の閾値を動かすと適合率と再現率はトレードオフになります(ROC曲線の文脈)。