用語解説

LLM(大規模言語モデル)とは?G検定での出題傾向

定義 · 仕組み · ChatGPTとの違い · 出題ポイント

チームでLLMの概念について学習する様子
出典:Unsplash(Brooke Cagle)
更新日: 読了目安:約8分

LLM(Large Language Model/大規模言語モデル)は、ChatGPTの基盤技術として一般に知られる、生成AI時代の中核用語です。G検定・生成AIパスポートの両方で頻出し、「次のトークンを予測する」という基本動作を理解することが試験対策の鍵になります。本記事では定義・仕組み・関連用語との違い・出題ポイントを整理します。詳細は用語辞典「LLM」もあわせてご覧ください。

LLMとは

LLMは、インターネット上の大量テキストなどで事前学習(Pre-training)された、パラメータ数が非常に多いニューラルネットワークベースの言語モデルです。

  • 英語表記 Large Language Model(大規模言語モデル)
  • 「大規模」の意味 パラメータ数(数十億〜数千億)と学習データ量が従来の言語モデルを大きく上回る
  • 基盤技術 多くがトランスフォーマーアーキテクチャを採用
  • 生成AIとの関係 LLMは生成AIを実現する主要なモデル種別のひとつ

仕組みの要点

試験では実装の詳細より、次の概念理解が中心です。

  • 次トークン予測 入力テキストの続きとして、次に来る確率が高いトークンを1つずつ予測して文章を生成
  • 事前学習と追加学習 大規模データで汎用能力を獲得(事前学習)→ファインチューニングRLHFで調整
  • コンテキストウィンドウ 一度に参照できる入力の最大長。コンテキストウィンドウが長いほど多くの文脈を保持
  • マルチモーダル化 テキストだけでなく画像・音声も扱うモデル(GPT-4oなど)が登場

関連用語との違い

用語 違い
言語モデル(LM) 次の語を予測するモデル全般。n-gramもLMの一種。LLMはその大規模版
ChatGPT OpenAIの対話型サービス。LLMを使ったアプリケーション
GPT Generative Pre-trained Transformer。OpenAIのモデル系列名
生成AI 新しいコンテンツを生成するAI全般。LLMはその実現手段のひとつ

代表的なモデル

試験で名前と特徴の対応が問われることがあります(最新情報は公式ソースで確認)。

  • GPT系列(OpenAI) ChatGPTの基盤。対話・文章生成に強い
  • Claude(Anthropic) 長文処理・安全性重視の設計が特徴
  • Gemini(Google) マルチモーダル対応。Google検索との連携
  • オープンソースモデル LLaMA、Mistralなど。自社環境での運用が可能

試験での出題ポイント

試験 出題の傾向 演習
G検定 NLP・生成AI応用、トランスフォーマー、事前学習の文脈 domain-05 · NLP分野解説
生成AIパスポート 第2章で頻出。主要モデルの特徴、LLMとサービスの違い 第2章
  • 定義の選択 LLMの正しい説明を選ぶ(次トークン予測、大規模な事前学習など)
  • 混同の排除 LLM=ChatGPT、LLM=検索エンジン、などの誤り
  • 関連技術 トランスフォーマー、RAGファインチューニングとの関係

よくある質問

LLMとは何の略ですか?

Large Language Model(大規模言語モデル)です。用語辞典で詳しく解説しています。

LLMとChatGPTは同じものですか?

同じではありません。LLMはモデル、ChatGPTはそのモデルを使ったサービスです。

LLMはどうやって文章を生成する?

次に来るトークンの確率を予測し、1つずつ繋げて文章を生成します。

どの試験で出題されますか?

G検定と生成AIパスポートの両方で頻出です。特に生成AIパスポート第2章を重点的に学習しましょう。