コンテキストウィンドウ(Context Window)は、LLMが一度の推論で参照できる文脈の長さの上限——ふつうトークン数で表されます。本記事はトークンの分割ルールの復習ではなく、上限に達したとき何が起き、何と混同しないか——実務チェックリスト——に焦点を当てます。
試験で問われる見方
正しい理解の核は、「モデルが一度に扱える入力や会話履歴の長さに関係する」ことです(TF-0170は○)。
代表的な誤答は、ウィンドウが大きいほど最新情報を自動検索できるという説明です(TF-0169は×)。長い文脈を扱いやすくなるだけで、ウェブ検索やリアルタイム知識更新とは別です。
コンテキストウィンドウとは
LLMは応答を作る際、プロンプト・会話の過去ログ・システム指示・生成中の出力などをまとめて文脈(コンテキスト)として扱います。コンテキストウィンドウは、その文脈が収まるトークン数の上限です。
モデルやバージョンごとに「128Kトークン」などと公表されます。大きいほど長いPDF・長いチャットを一度に渡しやすくなりますが、無制限ではありません。
何が枠を消費するか
上限にカウントされやすい要素を整理します(サービス実装で細部は異なります)。
- ユーザーの入力 — 貼り付けた長文・添付テキストの要約前原文
- 会話履歴 — 過去の質問と回答のやり取り
- システム・開発者指示 — システムプロンプトなど
- モデルの出力 — 生成される回答も枠を使う
- RAGで渡す検索結果 — 引用チャンクも入力の一部
日本語は英語よりトークン消費が大きくなりやすいため、同じ文字数でも枠を早く使い切ることがあります。
よくある誤解
| 誤解 | 実際 |
|---|---|
| 大きい=最新ニュースを自動取得 | ×。渡した文脈の範囲の話(TF-0169) |
| 大きい=常に正確 | 長文を読めるだけ。ハルシネーションは別問題 |
| 大きい=料金は同じ | 入力トークン課金なら、使うほどコスト増のことが多い |
| 会話を続ければ永遠に覚えている | 上限を超えると古い発言が切り捨てられる・要約される |
実務チェックリスト
長文・長期プロジェクトで枠を意識するときの確認項目です。