モデル・技術

コンテキストウィンドウとは?Context Window・文脈上限と実務

読み:こんてきすとうぃんどう / 英:Context Window

更新日: 読了目安:約6分

コンテキストウィンドウ(Context Window)は、LLM一度の推論で参照できる文脈の長さの上限——ふつうトークン数で表されます。本記事はトークンの分割ルールの復習ではなく、上限に達したとき何が起き、何と混同しないか——実務チェックリスト——に焦点を当てます。

試験で問われる見方

正しい理解の核は、「モデルが一度に扱える入力や会話履歴の長さに関係する」ことです(TF-0170は○)。

代表的な誤答は、ウィンドウが大きいほど最新情報を自動検索できるという説明です(TF-0169は×)。長い文脈を扱いやすくなるだけで、ウェブ検索やリアルタイム知識更新とは別です。

演習で確認する

生成AIパスポート:TF-0170(定義)TF-0169(誤解)

関連:トークンの記事、TF-0156

コンテキストウィンドウとは

LLMは応答を作る際、プロンプト・会話の過去ログ・システム指示・生成中の出力などをまとめて文脈(コンテキスト)として扱います。コンテキストウィンドウは、その文脈が収まるトークン数の上限です。

モデルやバージョンごとに「128Kトークン」などと公表されます。大きいほど長いPDF・長いチャットを一度に渡しやすくなりますが、無制限ではありません。

何が枠を消費するか

上限にカウントされやすい要素を整理します(サービス実装で細部は異なります)。

  • ユーザーの入力 — 貼り付けた長文・添付テキストの要約前原文
  • 会話履歴 — 過去の質問と回答のやり取り
  • システム・開発者指示システムプロンプトなど
  • モデルの出力 — 生成される回答も枠を使う
  • RAGで渡す検索結果 — 引用チャンクも入力の一部

日本語は英語よりトークン消費が大きくなりやすいため、同じ文字数でも枠を早く使い切ることがあります。

よくある誤解

誤解 実際
大きい=最新ニュースを自動取得 ×。渡した文脈の範囲の話(TF-0169)
大きい=常に正確 長文を読めるだけ。ハルシネーションは別問題
大きい=料金は同じ 入力トークン課金なら、使うほどコスト増のことが多い
会話を続ければ永遠に覚えている 上限を超えると古い発言が切り捨てられる・要約される

実務チェックリスト

長文・長期プロジェクトで枠を意識するときの確認項目です。

  1. モデルの上限を確認 — サービス仕様のトークン数・文字数目安
  2. 全文貼りより要約・抜粋 — 必要段落だけ渡す
  3. 話題が変わったら新規チャット — 履歴の累積を防ぐ
  4. 出力長を指定 — 「5項目まで」などで枠とコストを抑える
  5. 社内文書はRAGで分割取得チャンキングと検索で関連部分だけ渡す
  6. 機密データを無制限に履歴へ漏洩リスク。不要なら履歴を残さない

よくある質問

コンテキストウィンドウとトークンは同じ?

別概念です。トークンは処理単位、コンテキストウィンドウはその単位で測る上限です。トークンの記事も参照してください。

大きいウィンドウなら検索不要?

最新・社内・非公開の情報は、枠が大きくても学習データに無ければ知りません。RAGや検索連携が別途必要です。

上限を超えるとどうなる?

エラーになる、古い履歴が切られる、自動要約されるなど、製品次第です。長い会話では意図せず文脈が失われることがあります。

G検定でも出る?

生成AIパスポート第2章で重点的に出ます。G検定ではLLM・学習の基礎と合わせて、トークン・文脈の理解があるとよいです。