基礎・機械学習

適合率とは?Precision・「陽性と言ったうち何割が正しいか」

読み:てきごうりつ / 英:Precision

更新日: 読了目安:約6分

適合率(Precision)は、モデルが「陽性」と予測したもののうち、実際に陽性だった割合です。本記事は公式の暗記だけでなく、試験で問われる混同行列の読み方・偽陽性との関係・再現率との使い分けに焦点を当てます。

試験で問われる見方

適合率は陽性予測の精度。偽陽性(誤検知)が問題になる場面で重要(G-056の混同行列文脈)。

不均衡データでは正解率だけでは不十分で、適合率・再現率F1を併用(G-064)。

演習で確認する

G検定:G-056G-064G-140機械学習の概要

混同行列

予測:陽性予測:陰性
実際:陽性真陽性(TP)偽陰性(FN)
実際:陰性偽陽性(FP)真陰性(TN)

適合率は予測が陽性だった列(TP+FP)のうち TP の割合です。

定義のイメージ

適合率 = TP ÷ (TP + FP)

「陽性と判定したもののうち、何割が本当に陽性か」を測ります。FP が多いと適合率は下がります。

重視する場面

誤検知のコストが高いときに適合率を重視します。例:迷惑メール判定で正常メールをスパムにしない、不正検知で善良ユーザーをブロックしない、など。

見逃しを減らしたい場合は再現率を重視(G-084)。

よくある質問

適合率と正解率は同じ?

違います。正解率は全体の正解割合、適合率は陽性予測に限定した指標です。

閾値を変えると?

分類の閾値を動かすと適合率と再現率はトレードオフになります(ROC曲線の文脈)。