教師あり学習(Supervised Learning)は、入力データと正解ラベル(教師信号)のペアから、入出力の対応を学ぶ機械学習の代表的手法です。本記事はアルゴリズムの網羅ではなく、試験で問われる定義・分類と回帰・教師なしとの対比に焦点を当てます。
試験で問われる見方
教師あり学習は正解ラベル付きデータを使う。スパム判定・画像分類などが典型例(CSV定義・G検定頻出)。
教師なし学習では正解ラベルがないため、ラベルとの誤差を直接最小化するとは限らない(TF-354)。クラスタ内のまとまりや再構成誤差など別の基準を使う。
教師あり学習とは
各訓練サンプルが (入力 x, 正解 y) の形を持ちます。「教師」は正解ラベルの比喩です。モデルは予測 ŷ を出し、損失関数で y との差を測り、勾配降下法などでパラメータを更新します。
ニューラルネットによる画像認識も、教師あり学習の典型です。LLMの事前学習は次トークン予測という自己教師ありに近い設定もありますが、試験の「教師あり」はラベル付き教師信号を想定することが多いです。
二大タスク:分類と回帰
| タスク | 正解 y の型 | 例 |
|---|---|---|
| 分類 | カテゴリ(離散) | スパム/非スパム、犬/猫 |
| 回帰 | 連続値 | 売上予測、気温予測 |
出力層の設計と損失関数の選び方がタスクごとに変わります(分類:交差エントロピー、回帰:二乗誤差など)。
学習の流れ
- ラベル付きデータの収集・分割(訓練/検証/テスト)
- モデルの選択(線形、木、NN…)
- 損失最小化で学習
- 汎化性能の評価(過学習チェック)
教師なしとの違い
| 区分 | ラベル | 目的の例 |
|---|---|---|
| 教師あり | あり | 分類・回帰 |
| 教師なし | なし | クラスタリング、k-means |
| 強化学習 | 報酬信号 | 方策の最適化 |
「教師なしでも分類できる」は文脈次第ですが、ラベル付き教師信号なしに教師あり分類と同じ損失を使うという説明は×になりやすいです。
よくある質問
半教師あり学習は?
少量のラベル付きと大量のラベルなしを併用する設定です。教師あり・教師なしの中間に位置します。
LLMのファインチューニングは教師あり?
指示データに正解応答がある形式なら教師ありに近いです。RLHFは強化学習の要素も含みます。
ラベル作成が高いときは?
教師なし・半教師あり、転移学習、弱いラベルなどが検討されます。試験では区分の定義が中心です。