学習(Training/訓練)は、機械学習においてデータからモデルのパラメータを最適化するプロセスです。本記事は特定アルゴリズムの実装ではなく、学習と推論の分離・汎化の視点——試験で問われる基本構造——に焦点を当てます。
試験で問われる見方
訓練データで精度が高くても、未知データで同じ性能が保証されるわけではない(TF-0058×)。過学習で汎化性能が落ちうる、という論点が頻出です。
早期終了では訓練データだけでなく検証データの推移を見て学習を止める(G-185)。ドロップアウトは学習時に一部ユニットを無効化する(TF-070)。
学習とは
学習は、入力データと正解(ラベル)などから、損失関数を最小化するよう重みを更新する段階です。教師あり学習では正解との誤差、強化学習では報酬信号が指標になります。
学習が終わると学習済みモデルが得られ、本番では推論フェーズで予測に使います。LLMの事前学習・ファインチューニングも、この「学習」の延長上に位置づけられます。
推論との違い
| フェーズ | 目的 | 典型操作 |
|---|---|---|
| 学習 | パラメータを最適化 | 損失計算、誤差逆伝播、重み更新 |
| 推論 | 学習済みモデルで予測 | 順伝播、出力生成(重みは固定) |
データを集める作業そのものが学習ではありません(TF-309の誤答パターン)。
データと検証
- 訓練データ — パラメータ更新に使う
- 検証データ — ハイパーパラメータ調整・早期終了の判断
- テストデータ — 最終的な汎化性能の評価(学習に使わない)
検証やテストの情報が学習に漏れると、評価が楽観的になります(TF-370)。
過学習への対策
学習を長く回しすぎると過学習しやすくなります。代表的な対策です。
すり替えに注意
| 誤った説明 | 正しい理解 |
|---|---|
| 訓練精度高=未知データも同精度 | 汎化は保証されない(TF-0058) |
| 学習=データ収集 | パラメータ最適化のプロセス |
| 学習=推論 | 重み更新 vs 予測実行 |
| 訓練データだけ見れば十分 | 検証データで過学習を監視(G-185) |
よくある質問
学習とファインチューニングの違いは?
ファインチューニングも学習の一種です。事前学習済みモデルを特定タスク用データで追加学習する、という位置づけです。
エポックとは?
訓練データ全体を1周学習した単位です。試験では名前の暗記より「何度も回すと過学習しうる」のイメージで十分なことが多いです。
学習率は学習で更新される?
いいえ。TF-052のとおり学習率はハイパーパラメータで、人が設定します。