IoU(Intersection over Union、和集合に対する交差)は、予測領域と正解領域がどれだけ重なるかを測る評価指標です。物体検出のバウンディングボックス(G-316)も、セグメンテーションのマスクも、同じ「重なり÷全体」で採点できる——本記事は式の暗記より、「なぜ位置のずれを面積比で測るのか」と、正解率・Diceとのすり替え回避に焦点を当てます。
重なりで測る理由
画像分類は「何が写っているか」だけを当てます。物体検出はどこに何があるか——位置をバウンディングボックスで示します(G-021、TF-115)。
クラス名が合っていても、箱の位置がズレていれば実用には不十分——IoUは位置の精度を数値化します。評価指標はタスクに応じて選ぶ必要があり(G-474)、検出・セグではIoUが定番の物差しの一つです。
IoUの直感
予測領域を B、正解領域を G(Ground truth)とすると:
IoU =(BとGの交差面積)÷(BとGの和集合面積)
| 状況 | IoUの目安 | 意味 |
|---|---|---|
| 完全重なり | 1.0 | 予測と正解が一致 |
| 少しズレ | 0.5〜0.7付近 | 実務では「当たり」とみなす閾値の候補 |
| かすっている | 0に近い | 別物体の誤検出の可能性 |
| 重なりなし | 0 | マッチしない |
別名Jaccard index(ジャッカード指数)として統計・集合論でも登場します——集合の類似度を測る発想が、画像の領域評価にそのまま移植されています。
物体検出での使い方
Faster R-CNNやYOLOは、画像内の複数物体それぞれにボックスを出力します(G-323)。評価では、予測ボックスと正解ボックスをIoUでペアリングし、閾値(例:0.5)以上なら「正しく検出した」と数えます。
- マッチング — 予測と正解をIoUで対応づけ
- 閾値判定 — IoU ≥ 0.5 などで True Positive か決める
- 精度・再現率 — マッチ結果から適合率・再現率を計算(G-090)
- 重複除去 — NMSで同じ物体への複数ボックスを整理
IoUは損失関数そのものではなく評価指標が主な役割です(学習では滑らかな近似損失を使うこともあります)。G-274の誤答「適合率を計算する指標」——IoUは重なりを測り、適合率はマッチング後に別途計算します。
セグメンテーションとの関係
画素単位のマスクでも、IoUは前景領域同士の重なりとして定義できます。FCNやMask R-CNN(G-326)のマスク品質評価に使われます。
| 指標 | 式のイメージ | 主な用途 |
|---|---|---|
| IoU | 交差 ÷ 和集合 | 検出・セグの評価 |
| Dice係数 | 2×交差 ÷(A+B) | セグ評価・Dice Loss |
| 正解率 | 正解画素 ÷ 全画素 | 分類・セグの画素精度 |
DiceとIoUは親戚ですが同義ではありません——小さな領域では値の差が目立ちます。試験では「重なりを測る指標」としてIoUを、学習損失としてDice Lossを、と役割で分けます。
試験で押さえるポイント
- 定義 — 交差面積 ÷ 和集合面積(重なり度合い)
- 対象 — バウンディングボックス・マスクなど位置付き領域
- 用途 — 物体検出のマッチング、セグメンテーション評価
- 対比 — 正解率=クラス当て、IoU=領域の位置精度
すり替えに注意
| 誤った説明 | 正しい理解 |
|---|---|
| IoU=正解率 | 領域の重なり vs クラス当ての割合 |
| IoU=適合率 | 重なり指標 vs 検出結果の精度(別計算) |
| IoU=Dice Loss | 評価指標 vs 学習損失(Dice係数は近いが別定義) |
| IoU=バウンディングボックス | 評価の物差し vs 位置の表現形式 |
| IoU=1×1畳み込み | 重なり評価 vs CNNの層操作(G-274) |
よくある質問
IoUは何を測る指標ですか?
予測した領域(バウンディングボックスやマスク)と正解領域がどれだけ重なるかを0〜1付近の数値で表す指標です。交差部分の面積を和集合の面積で割り、完全に一致すれば1、全く重ならなければ0に近づきます。物体検出では予測ボックスと正解ボックスのマッチング判定にも使われます。
IoUとDice係数は同じですか?
同じではありません。どちらも領域の重なりを測りますが、IoUは交差÷和集合、Dice係数は2×交差÷(領域A+領域B)と定義が異なります。セグメンテーションでは両方が評価・損失(Dice Loss)に使われますが、数式と値のスケールは一致しません。
IoUは分類の正解率と同じですか?
同じではありません。正解率は画像全体や画素のクラス当てが合った割合です。IoUは位置付きの領域(ボックスやマスク)の重なりを測る指標で、物体検出やセグメンテーションの評価に使われます。タスクと測る対象が異なります。