基礎・機械学習

モデル(Model)とは?学習済み表現とAIシステム

読み:もでる / 英:Model

更新日: 読了目安:約7分

モデル(Model)は、入力から出力への変換を表す数学的・計算的な表現です。本記事は個別製品のベンチマークではなく、アルゴリズム・学習済みウェイト・サービス名——試験で層が混同されやすい用語——の整理に焦点を当てます。

試験で問われる見方

ニューラルネットワークは、データからパラメータを学習するモデルです。ルールを人が手入力するだけの決定木説明と混同しない(TF-416)。

学習率などのハイパーパラメータは誤差逆伝播で自動学習されるわけではない(TF-052)。モデルの「学習されるもの」と「人が設定するもの」を分けます。

演習で確認する

G検定:TF-416TF-052G-118TF-003

モデルとは

モデルは、データのパターンを捉える関数+パラメータの組です。線形回帰、決定木、ニューラルネットTransformer——構造(アーキテクチャ)が異なっても、入力を出力に写す「モデル」という点は共通です。

学習でパラメータが決まり、推論でそのモデルを使って予測します。ファイルとして保存されたウェイト(チェックポイント)も、日常語では「モデル」と呼ばれます。

混同しやすい層

用語指すもの
モデル(本記事)入力→出力の計算表現(構造+パラメータ)
アルゴリズム学習手順・最適化の方法(例:勾配降下)
アーキテクチャ層のつながり方(例:GPT
製品・サービスChatGPTなどUI・APIを含む提供形態

「GPT-4というモデル」と言うときは製品世代名であり、厳密にはウェイト・設定・サービスの束です。

学習と推論

  1. 設計 — アーキテクチャと損失関数を選ぶ
  2. 学習 — データでパラメータを更新
  3. 評価 — 検証・テストで性能を測る
  4. 推論 — 本番入力で予測・生成
  5. 更新ファインチューニングや再学習

規模が大きいほど学習時間・電力が問題になりうる(G-118)。

モデルカード等

実務ではモデルカードデータシートに、用途・限界・学習データの概要が記載されます。モデル単体の性能だけでなく、どこで使ってよいかがガバナンスの論点です。

すり替えに注意

誤った説明正しい理解
NN=ルール手入力の決定木データからパラメータを学習(TF-416
学習率もモデルが学習ハイパーパラメータ(TF-052
モデル=ChatGPTサービス計算表現 vs 製品
モデル=データセットデータは学習に使う。モデルは変換の表現

よくある質問

基盤モデルとは?

大規模データで事前学習したモデルで、下流タスクに適応させる起点、という意味で使われます。LLMの文脈で頻出です。

オープンモデルとは?

ウェイトや仕様が公開され、ローカル推論などがしやすいモデルです。ライセンスは製品ごとに確認が必要です。

モデルとAIは同じ?

AIは広い概念、モデルはその中核となる計算表現の一つです(TF-003)。