基礎・機械学習

学習(Training)とは?モデル訓練・汎化性能

読み:がくしゅう / 英:Training

更新日: 読了目安:約7分

学習(Training/訓練)は、機械学習においてデータからモデルのパラメータを最適化するプロセスです。本記事は特定アルゴリズムの実装ではなく、学習と推論の分離・汎化の視点——試験で問われる基本構造——に焦点を当てます。

試験で問われる見方

訓練データで精度が高くても、未知データで同じ性能が保証されるわけではないTF-0058×)。過学習で汎化性能が落ちうる、という論点が頻出です。

早期終了では訓練データだけでなく検証データの推移を見て学習を止める(G-185)。ドロップアウト学習時に一部ユニットを無効化する(TF-070)。

演習で確認する

生成AIパスポート:TF-0058

G検定:G-185TF-070TF-370

学習とは

学習は、入力データと正解(ラベル)などから、損失関数を最小化するよう重みを更新する段階です。教師あり学習では正解との誤差、強化学習では報酬信号が指標になります。

学習が終わると学習済みモデルが得られ、本番では推論フェーズで予測に使います。LLMの事前学習・ファインチューニングも、この「学習」の延長上に位置づけられます。

推論との違い

フェーズ目的典型操作
学習パラメータを最適化損失計算、誤差逆伝播、重み更新
推論学習済みモデルで予測順伝播、出力生成(重みは固定)

データを集める作業そのものが学習ではありません(TF-309の誤答パターン)。

データと検証

  • 訓練データ — パラメータ更新に使う
  • 検証データ — ハイパーパラメータ調整・早期終了の判断
  • テストデータ — 最終的な汎化性能の評価(学習に使わない)

検証やテストの情報が学習に漏れると、評価が楽観的になります(TF-370)。

過学習への対策

学習を長く回しすぎると過学習しやすくなります。代表的な対策です。

すり替えに注意

誤った説明正しい理解
訓練精度高=未知データも同精度汎化は保証されない(TF-0058
学習=データ収集パラメータ最適化のプロセス
学習=推論重み更新 vs 予測実行
訓練データだけ見れば十分検証データで過学習を監視(G-185

よくある質問

学習とファインチューニングの違いは?

ファインチューニングも学習の一種です。事前学習済みモデルを特定タスク用データで追加学習する、という位置づけです。

エポックとは?

訓練データ全体を1周学習した単位です。試験では名前の暗記より「何度も回すと過学習しうる」のイメージで十分なことが多いです。

学習率は学習で更新される?

いいえ。TF-052のとおり学習率はハイパーパラメータで、人が設定します。