早期終了(Early Stopping)は、学習を延ばしすぎて過学習に入る前に、検証データの性能悪化を手がかりに学習を打ち切る手法です。本記事はハイパーパラメータの細部ではなく、試験で問われる「何を見て止めるか」「ドロップアウトとの対比」に焦点を当てます。
試験で問われる見方
○:早期終了は検証データの損失や評価指標を見て、過学習が始まる前に学習を止める(G-185)。訓練データだけでは不十分。
○:ドロップアウトと早期終了は別の正則化手法(G-168の(あ)ドロップアウト・(い)早期終了)。
どう動くか
エポックごとにモデルを更新しながら、検証セットで性能を測ります。検証損失が下がり止まったり上昇し始めたりした時点で学習を終了し、その直前の重みを採用するのが典型です。
参照する指標
- 検証損失 — 最も一般的な監視対象
- 検証精度・F1など — タスクに応じた指標
- 訓練だけ — ×。過学習の兆候を見逃す(G-185)
他手法との違い
| 手法 | 働き |
|---|---|
| ドロップアウト | 各ステップでユニットをランダム無効化 |
| L1/L2正則化 | 重みにペナルティ |
| 早期終了 | 学習の長さ(エポック)を制御 |
よくある質問
ベストなエポック数は事前に分かる?
一般には分かりません。検証監視か早期終了で決めるのが実務的です。
LLMの学習でも使う?
はい。検証セットでの損失やベンチマーク性能で打ち切る運用があります。