モデル・技術

GPTアーキテクチャとは?デコーダ型・自己回帰・学習の流れ

読み:じーぴーてぃーあーきてくちゃ / 英:GPT Architecture

更新日: 読了目安:約7分

GPTアーキテクチャは、Transformerデコーダ(Decoder)側を中心に積み重ね、次のトークンを順に予測する自己回帰型の言語モデル構造です。本記事はGPTの製品史ではなく、「なぜデコーダのみか」「BERTと何が違うか」——構造の分岐——に焦点を当てます。

試験で問われる見方

○:GPT系はTransformerのデコーダ構造を基盤とし、次のトークン予測で文章生成能力を獲得(TF-427)。自己回帰的な言語モデルとして説明される。

対比:BERTはTransformerのエンコーダを用いた自然言語処理モデル(TF-425)。BERTをGANや画像専用とする説明は×(TF-426)。

デコーダのみの意味

原典のTransformerは機械翻訳向けにエンコーダ+デコーダの二部構成でした。GPT系列はそのうちデコーダブロックSelf-Attention+FFNなど)を深く積み、単一のテキスト列から次を予測する形に特化します。

試験では層数の暗記より、「デコーダ中心の自己回帰生成」というラベルが重要です。

構成典型例向き
エンコーダのみBERT文全体の理解・分類・埋め込み
デコーダのみGPT左から右へトークン生成
エンコーダ+デコーダ翻訳モデル(T5等)入力系列→出力系列

自己回帰生成の流れ

推論時のイメージ(試験向けの簡略版)です。

  1. プロンプトをトークン列に変換
  2. これまでのトークン列を入力し、次の1トークンの確率分布を出力
  3. サンプリングまたは最尤で1トークンを選び、列の末尾に追加
  4. 終了条件まで繰り返し(コンテキストウィンドウの範囲内)

学習時は正解文の各位置で「次のトークン」を予測する教師あり学習として、誤差逆伝播法勾配降下法で重みを更新します。

BERT(エンコーダ)との対比

GPT(デコーダ型)BERT(エンコーダ型)
主な学習次トークン予測(因果的マスク)マスク言語モデル等(双方向文脈)
得意文章生成・続き書き分類・理解・検索向け表現
生成自己回帰で自然に生成生成は別設計が必要なことが多い
試験TF-427TF-425

どちらもTransformer系ですが、使う側(エンコーダ/デコーダ)と学習目的が異なります。

学習パイプライン

実務・試験の橋渡しとして、よく語られる段階です(詳細は製品により異なります)。

  • 事前学習(Pre-training) — 大規模テキストで次トークン予測。汎用の言語能力
  • 指示追従・タスク適応ファインチューニングや教師付きデータで用途に合わせる
  • 人間の好みへの調整RLHFなど(アライメント
  • サービス化ChatGPTのような対話UI・API

アーキテクチャは構造、RLHFは調整手法、ChatGPTはサービス——層を混同しないでください。

よくある質問

因果的マスクとは?

生成時、未来のトークンを見えないようにする制約です。自己回帰学習の整合性のため。試験では名前の暗記より「未来を見ずに次を予測」のイメージで十分なことが多いです。

GPTアーキテクチャ=LLM?

GPTはLLMの代表的実装の一つです。LLMは規模の大きな言語モデルというクラス名(LLM)。

画像GPTもある?

試験の典型文脈は自然言語のGPT系列です。画像は別アーキテクチャ(拡散モデル等)が主流です(TF-428)。