モデル(Model)は、入力から出力への変換を表す数学的・計算的な表現です。本記事は個別製品のベンチマークではなく、アルゴリズム・学習済みウェイト・サービス名——試験で層が混同されやすい用語——の整理に焦点を当てます。
試験で問われる見方
ニューラルネットワークは、データからパラメータを学習するモデルです。ルールを人が手入力するだけの決定木説明と混同しない(TF-416)。
学習率などのハイパーパラメータは誤差逆伝播で自動学習されるわけではない(TF-052)。モデルの「学習されるもの」と「人が設定するもの」を分けます。
モデルとは
モデルは、データのパターンを捉える関数+パラメータの組です。線形回帰、決定木、ニューラルネット、Transformer——構造(アーキテクチャ)が異なっても、入力を出力に写す「モデル」という点は共通です。
学習でパラメータが決まり、推論でそのモデルを使って予測します。ファイルとして保存されたウェイト(チェックポイント)も、日常語では「モデル」と呼ばれます。
混同しやすい層
| 用語 | 指すもの |
|---|---|
| モデル(本記事) | 入力→出力の計算表現(構造+パラメータ) |
| アルゴリズム | 学習手順・最適化の方法(例:勾配降下) |
| アーキテクチャ | 層のつながり方(例:GPT) |
| 製品・サービス | ChatGPTなどUI・APIを含む提供形態 |
「GPT-4というモデル」と言うときは製品世代名であり、厳密にはウェイト・設定・サービスの束です。
学習と推論
- 設計 — アーキテクチャと損失関数を選ぶ
- 学習 — データでパラメータを更新
- 評価 — 検証・テストで性能を測る
- 推論 — 本番入力で予測・生成
- 更新 — ファインチューニングや再学習
規模が大きいほど学習時間・電力が問題になりうる(G-118)。
モデルカード等
実務ではモデルカードやデータシートに、用途・限界・学習データの概要が記載されます。モデル単体の性能だけでなく、どこで使ってよいかがガバナンスの論点です。
すり替えに注意
| 誤った説明 | 正しい理解 |
|---|---|
| NN=ルール手入力の決定木 | データからパラメータを学習(TF-416) |
| 学習率もモデルが学習 | ハイパーパラメータ(TF-052) |
| モデル=ChatGPTサービス | 計算表現 vs 製品 |
| モデル=データセット | データは学習に使う。モデルは変換の表現 |