LLM(Large Language Model/大規模言語モデル)は、ChatGPTの基盤技術として一般に知られる、生成AI時代の中核用語です。G検定・生成AIパスポートの両方で頻出し、「次のトークンを予測する」という基本動作を理解することが試験対策の鍵になります。本記事では定義・仕組み・関連用語との違い・出題ポイントを整理します。詳細は用語辞典「LLM」もあわせてご覧ください。
LLMとは
LLMは、インターネット上の大量テキストなどで事前学習(Pre-training)された、パラメータ数が非常に多いニューラルネットワークベースの言語モデルです。
仕組みの要点
試験では実装の詳細より、次の概念理解が中心です。
- 次トークン予測 入力テキストの続きとして、次に来る確率が高いトークンを1つずつ予測して文章を生成
- 事前学習と追加学習 大規模データで汎用能力を獲得(事前学習)→ファインチューニングやRLHFで調整
- コンテキストウィンドウ 一度に参照できる入力の最大長。コンテキストウィンドウが長いほど多くの文脈を保持
- マルチモーダル化 テキストだけでなく画像・音声も扱うモデル(GPT-4oなど)が登場
関連用語との違い
| 用語 | 違い |
|---|---|
| 言語モデル(LM) | 次の語を予測するモデル全般。n-gramもLMの一種。LLMはその大規模版 |
| ChatGPT | OpenAIの対話型サービス。LLMを使ったアプリケーション |
| GPT | Generative Pre-trained Transformer。OpenAIのモデル系列名 |
| 生成AI | 新しいコンテンツを生成するAI全般。LLMはその実現手段のひとつ |
代表的なモデル
試験で名前と特徴の対応が問われることがあります(最新情報は公式ソースで確認)。
- GPT系列(OpenAI) ChatGPTの基盤。対話・文章生成に強い
- Claude(Anthropic) 長文処理・安全性重視の設計が特徴
- Gemini(Google) マルチモーダル対応。Google検索との連携
- オープンソースモデル LLaMA、Mistralなど。自社環境での運用が可能
試験での出題ポイント
| 試験 | 出題の傾向 | 演習 |
|---|---|---|
| G検定 | NLP・生成AI応用、トランスフォーマー、事前学習の文脈 | domain-05 · NLP分野解説 |
| 生成AIパスポート | 第2章で頻出。主要モデルの特徴、LLMとサービスの違い | 第2章 |
- 定義の選択 LLMの正しい説明を選ぶ(次トークン予測、大規模な事前学習など)
- 混同の排除 LLM=ChatGPT、LLM=検索エンジン、などの誤り
- 関連技術 トランスフォーマー、RAG、ファインチューニングとの関係