GPT-1は、OpenAIが2018年に発表した初代のGPT(Generative Pre-trained Transformer)モデルです。Transformerを基盤にした言語モデルとして、後のGPT系列の原型を示しました。本記事はベンチマークの細部より、試験で押さえる系列の流れ——GPT-1が「どこから始まったか」——に焦点を当てます。
試験で問われる見方
生成AIパスポートでは、GPT-1はGPTモデル系列の初期モデルとして扱われます(TF-0117)。GPT-2・GPT-3・GPT-3.5・GPT-4へと続く発展の出発点として整理するのが試験対策の基本です。
細かなパラメータ数や論文の数値より、「Transformerベースの自己回帰言語モデル系列の最初」という位置づけが問われます。性能比較の暗記は優先度が低いです。
GPT-1とは
GPT-1は、GPTアーキテクチャ(デコーダのみのTransformer)を用いた事前学習+ファインチューニングの言語モデルです。大規模テキストでまず学習し、下流タスク用に調整する二段階の枠組みが、後のLLM研究の標準的な流れの先駆けとなりました。
規模は現行モデルと比べ非常に小さく(約1.17億パラメーター)、研究論文として公開された段階のモデルです。一般ユーザーが直接触るサービスとして広まったのは、はるか後のChatGPT以降です。
GPT系列の中での位置
| モデル | 試験で覚えるポイント |
|---|---|
| GPT-1 | 系列の初代。Transformer言語モデルの原型 |
| GPT-2 | GPT-1の約10倍規模。生成品質の向上が話題に |
| GPT-3 | 大規模化とFew-shot学習で汎用性が注目 |
| GPT-3.5以降 | インストラクション追従・ChatGPTの基盤へ |
試験では「どのモデルが最新で最強か」より、系列としてどう発展したかの流れを答えられることが重要です。
すり替えに注意
| 誤った説明 | 正しい理解 |
|---|---|
| GPT-1=ChatGPT | 2018年の研究モデル vs 2022年以降のサービス |
| GPT-1=生成AI全体 | GPTは生成AIを実現するモデル系列の一つ |
| GPT-1=BERT | GPTはデコーダ系の生成、BERTはエンコーダ系が典型 |
よくある質問
GPT-1はChatGPTのことですか?
いいえ。GPT-1は2018年の研究モデルであり、2022年登場のChatGPT(サービス)やその中核モデルとは別物です。試験ではモデル名とサービス名を分けて答えます。
GPT-1は試験で暗記が必要ですか?
パラメータ数の細かい暗記より、GPT系列の初期モデルとして位置づけられること——GPT-2以降の発展の出発点——が重要です。
GPT-1とGPTアーキテクチャの違いは?
GPTアーキテクチャは設計の型(デコーダのみTransformer)、GPT-1はその型を使った最初の具体モデルです。詳しくはGPTアーキテクチャの記事を参照してください。