モデル・技術

GPT-5.3-Codexとは?エージェント型コーディングと安全性High分類

読み:じーぴーてぃーごてんさんコーデックス / 英:GPT-5.3-Codex

更新日: 読了目安:約6分

GPT-5.3-Codexとは、OpenAIが2026年2月5日にリリースしたエージェント型コーディング特化の大規模言語モデルです。GPT-5.2の推論能力とGPT-5.2-Codexのコーディング性能を統合し、前モデル比25%高速化を実現しました。OpenAIが「自分自身の開発に参加した初のモデル」と表現し、安全性評価枠組みでサイバーセキュリティ分野に初めて「High」分類されました。本記事は「GPT-5.3-Codex=コード補完ツール」という過小評価を中心に解説します。

試験で問われる見方

G検定では、GPT-5.3-Codexが「AIエージェントによるソフトウェア開発ライフサイクルの自動化」の具体例として出題されます。 コードの検索・実行・デバッグをエージェントが連続して行う能力は、従来のコード補完ツールとは質的に異なる点です。

生成AIパスポートでは「AIの安全性評価とリスク管理」の文脈でPreparedness Frameworkの概念と合わせて問われることがあります。 High分類への対応として導入された「Trusted Access for Cyber」プログラムは、AIガバナンスの実例として重要です。

演習で確認する

生成AIパスポート:TF-0150(Codex)TF-0238(エージェント)

G検定:TF-204(インジェクション)

GPT-5.3-Codexとは

GPT-5.3-Codexは、GPT-5.2のリリースからわずか約2ヶ月後の2026年2月5日にリリースされました。 Codexアプリ・CLI・IDE拡張機能・ウェブインターフェースから利用でき、 GitHub CopilotではGPT-4.1に代わるベースモデルとして採用されました(初のLTSモデルとして2027年2月まで12ヶ月保証)。

「コーディング特化」と名前に入っていますが、その実態はコード生成だけでなく、 リポジトリ検索・ターミナルコマンドの実行・デバッグ・デプロイまでを一連のエージェント型ワークフローとして扱えるモデルです。 OpenAIは「コーディングを超えた汎用エージェント」として位置づけています。

自己開発への参加

GPT-5.3-Codexは、OpenAI公式として「自身の開発に参加した初のモデル」と説明されています。 開発チームは早期バージョンのGPT-5.3-Codexを使って、モデル自身のトレーニングデバッグ・デプロイ管理・テスト評価を行いました。 OpenAIによるとこのセルフ加速によって開発が大幅に短縮されたとのことです。

これはAIがAI開発を補助する「再帰的自己改善」の実用的な初段階として注目されており、 AI研究のロードマップ議論でも頻繁に参照されます。

サイバーセキュリティ「High」分類

OpenAIのPreparedness Framework(安全性評価枠組み)では、モデルの危険性を複数のドメインで評価します。 GPT-5.3-Codexはサイバーセキュリティドメインで初めて「High」に分類されました。 これはモデルがサイバー攻撃の自動化規模拡大や脆弱性の発見・悪用を支援できる可能性があるとOpenAIが判断したことを意味します。

対応策として、OpenAIは以下の措置を実施しました。最先端のサイバー攻撃的用途へのアクセスを審査済みの信頼パートナーに限定する「Trusted Access for Cyber」プログラム、 セキュリティ研究エージェント「Aardvark」の拡大ベータ、 オープンソースのサイバー防衛向けAPIクレジット1,000万ドルの提供です。

主要スペック

項目内容
リリース日2026年2月5日
前モデル比速度25%高速
主要ベンチマークSWE-Bench Pro・Terminal-Bench 2.0でSOTA
安全性分類サイバーセキュリティ:High(Preparedness Framework)
LTSステータスGitHub Copilot向けに2027年2月まで12ヶ月保証
提供形態Codexアプリ・CLI・IDE拡張・ウェブ(API準備中)
派生モデルGPT-5.3-Codex Spark(2026年2月12日、テキストのみ)

すり替えに注意

誤った説明正しい理解
GPT-5.3-Codexはコード補完専用のツールである リポジトリ検索・実行・デバッグ・デプロイを含む汎用エージェント。OpenAIは「コーディングを超えた」と説明
「自己開発に参加」とは、モデルが自律的に自分を改良したということ 開発チームが早期バージョンを開発補助ツールとして使ったこと。モデルが自律的にウェイトを変更したわけではない
サイバーセキュリティ「High」分類はモデルが危険なので使えないことを意味する 一定の安全管理下(Trusted Accessプログラム等)で提供が継続されている。High分類はリスク管理の透明性確保を目的とする

よくある質問

GPT-5.3-Codexが「自分自身の開発に参加した」とはどういう意味ですか?

開発チームがGPT-5.3-Codexの早期バージョンをモデル自身のトレーニングのデバッグ、デプロイ管理、テスト結果の評価に使用したということです。AIがAIの開発を補助した初の事例としてOpenAIが公式に言及しています。

GPT-5.3-CodexはサイバーセキュリティでなぜHigh分類なのですか?

OpenAIのPreparedness Framework(安全性評価枠組み)における「High」は、モデルがサイバー攻撃の自動化やエクスプロイトの発見・悪用を支援できる可能性があるとOpenAIが判断した場合に付与されます。GPT-5.3-Codexは初めてこの閾値を満たしたモデルとして分類されました。

GPT-5.3-Codex SparkとGPT-5.3-Codexの違いは何ですか?

GPT-5.3-Codex Sparkは2026年2月12日にリサーチプレビューとして公開された小型バージョンです。テキスト入力のみ対応(マルチモーダル非対応)で、計算コストを抑えたい用途向けです。