OpenAI · AIエージェント

ChatGPT Operatorとは?Web操作エージェント(CUA)の機能・使い方を解説

スクリーンショットでWebを「見て」、クリック・入力まで代行するOpenAIのブラウザエージェント

CUAモデル agent mode統合(2025年7月〜) 人間承認つき実行
対応環境
  • ChatGPT Web / アプリ
  • agent mode(有料プラン)
  • (旧)operator.chatgpt.com
OpenAI ChatGPTの公式イメージ。Operatorは2025年7月以降agent modeとして統合
出典:OpenAI(ChatGPT)
更新日: 読了目安:約9分

ChatGPT Operatorは、OpenAIが2025年1月に公開したWebブラウザ操作エージェントです。中核はComputer-Using Agent(CUA)——スクリーンショットで画面を認識し、クリック・スクロール・入力で人間と同じGUIを操作します。2025年7月、Operatorの能力はChatGPT内の「agent mode」に統合され、単体サイトは段階的に終了方向となりました。本記事は機能一覧の暗記ではなく、「回答するChatGPT」と「動くOperator」の境界試験で問われる安全設計(承認・権限制御)Manus・Devinとの棲み分けに焦点を当てます。料金・提供地域は2026年6月時点の公式情報に基づき、利用前に必ず再確認してください。

試験で問われる見方

生成AIパスポート第3章「AIエージェント」では、Operatorのような外部ツール(ブラウザ)を使うエージェントが具体例として扱われます。重要なのは「便利だから任せっきり」ではなく、実行権限・データ範囲・人間の承認を設計すること——という整理です。

Operator公式が強調するTakeover mode(ログイン・決済は人が操作)User confirmations(注文確定前の承認)Watch mode(メール等の監視下実行)は、試験の「影響の大きい操作には承認ステップを組み込む(○)」とそのまま対応します。また「自律性が高いから制約不要(×)」という引っかけ問題(TF-0281)に対して、Operator利用時こそ禁止サイト・予算上限・完了条件をプロンプトで明示する——という実務例として覚えると定着しやすいです。

ChatGPT Operatorとは

Operatorは、OpenAIが「自分専用のブラウザを持ち、Web上でタスクを実行するエージェント」として位置づけた研究プレビューです。API連携のないサイトでも、人間と同じボタン・フォーム・メニューを操作できる点が特徴です。

技術的な心臓部はCUA(Computer-Using Agent)モデル。GPT-4o系の視覚理解強化学習を組み合わせ、スクリーンショットからGUI要素を読み取り、マウス・キーボード操作に変換します。WebArenaやWebVoyagerといったブラウザ操作ベンチマークで高いスコアが報告されています(OpenAI公式ブログ)。

典型タスクは、フォーム入力、商品検索、レストラン予約、旅行の下書き、競合調査からスライド作成まで幅広いです。ただし2025年1月時点では米国のChatGPT Proユーザー限定の研究プレビューであり、スライドやカレンダー操作など複雑UIでは失敗も報告されていました。試験では「エージェント=万能」ではなく、得意・不得意とリスクをセットで理解することが求められます。

Operatorからagent modeへ

Operatorの製品史を時系列で押さえると、2026年時点の「どこから使うか」が混乱しにくくなります。

時期 公式の位置づけ 利用者が知っておくこと
2025年1月 Operator研究プレビュー公開 operator.chatgpt.com・米国Pro限定。CUAモデルを初公開。
2025年7月 ChatGPT agent(agent mode)として統合 Composerのツールから「agent mode」を選択。deep researchの分析力とOperatorのWeb操作を統合(公式ブログ)。
2025年7月以降 単体Operatorサイトのsunset operator.chatgpt.comは数週間の猶予後に終了方向。新規利用はChatGPT内が公式導線。
2026年6月時点 agent modeが標準的なアクセス方法 本記事の「Operator」は能力名称+製品史として理解し、実際の操作はChatGPTのagent modeを指すことが多い。

統合後のagent modeは、仮想ブラウザ・テキストブラウザ・ターミナル・APIを状況に応じて切り替える「統合エージェント」へ進化しています。Operator単体時代より、調査(deep research系)と実行(CUA系)が同一チャット内で続けられるのが大きな変化です。

できること(主な機能)

GUIブラウザ操作(CUA)

スクリーンショットベースでクリック・入力・スクロール。カスタムAPIのないWebサイトも操作対象にできる(公式説明)。

Takeover mode

ログイン・決済・CAPTCHAなど敏感な操作はユーザーがブラウザを引き継ぎ。Takeover中の入力はOperator側が収集しない設計(公式)。

User confirmations

注文確定・メール送信など影響の大きい操作の前に承認を要求。試験の「人間の承認ステップ」と直結する機能。

Watch mode

メールや金融系など敏感サイトでは、ユーザーの監視下で動作。エージェント単独の暴走を抑える公式の安全策。

カスタム指示・保存プロンプト

サイト別の好み(例:航空会社の指定)や、繰り返しタスク用の保存プロンプト(Operator単体時代の公式機能)。

agent mode統合後の拡張

Connectors(Gmail等)、ターミナル、スライド・表計算の生成、定期実行タスクなど。Operator単体ではできなかった分析→成果物の一気通貫が可能に。

安全設計の3層(Operator研究プレビュー時点)

OpenAI公式は、Operatorの安全を次の3層で説明しています。agent mode統合後も思想は継承されています。

内容 試験・実務での覚え方
ユーザー制御 Takeover・承認・Watch mode・高リスクタスクの拒否 「自動化=無承認」ではない具体例
プライバシー ブラウジングデータ削除、学習オプトアウト 業務利用前のデータ取り扱い確認
敵対的サイト対策 プロンプトインジェクション検知、監視モデル 外部Webは信頼できない入力源——エージェント設計の前提

よくある誤解

最大の誤解は「Operator=ChatGPTそのもの」です。通常のChatGPTは対話と生成が中心ですが、Operator(agent mode)はブラウザ上で行動するエージェント層です。試験では「生成AIアプリ」と「エージェント機能」を分けて整理してください。

もう1つは「Operator=Manus」という混同です。どちらもWeb操作を含みますが、OperatorはOpenAI ChatGPT契約内の統合エージェント、ManusはMonica.im発の独立サンドボックスです。実行環境・料金体系・データ所在地が異なるため、社内規程の観点では別ツールとして扱うべきです。

2025年1月のデモ動画=2026年も同じUI」も注意点です。単体Operator UIはsunset方向であり、現在はagent modeが正規ルートです。古い記事・SNS投稿のスクリーンショットは製品名・導線が古い可能性があります。

料金・利用上限(2026年6月時点)

Operator単体時代(2025年1月)はChatGPT Pro($200/月)+米国限定でした。2025年7月のagent mode統合以降、公式ブログでは次の上限が示されています(2026年6月時点でもこの枠組みが基本。最新はChatGPTの設定画面で確認してください)。

Plus / Team

$20/月〜

agent mode 月40メッセージ(公式・2025年7月)

Pro

$200/月

agent mode 月400メッセージ(公式・2025年7月)

Enterprise / Education

要問合せ

2025年7月以降順次提供。管理機能は組織契約依存

項目 Operator単体(2025年1月) agent mode統合後(2025年7月〜)
アクセス operator.chatgpt.com ChatGPT Composer → agent mode
対象プラン Pro(米国) Pro / Plus / Team(Enterprise等は順次)
月間上限 公式はメッセージ数より研究プレビュー枠 Pro 400 / Plus・Team 40(追加はクレジット制オプション)
地域 米国から開始 EEA・スイスは2025年7月時点「準備中」(公式)

無料プランではagent modeは使えません。1タスクが長時間になるとメッセージ上限に達しやすいため、目的・完了条件を短く区切る運用が現実的です。

はじめ方・基本的な使い方

2026年6月時点の推奨フローは、ChatGPT内のagent modeです(単体Operatorサイトは終了方向)。

  1. 有料プランを確認 ChatGPT Plus以上でagent modeが利用可能か、アカウントの地域・上限を確認します。
  2. agent modeを選択 Composerのツールドロップダウンから「agent mode」を選び、タスクを自然文で指示します(例:「公開情報のみで競合3社のPricingを表にまとめて」)。
  3. 実行ナレーションを監視 画面上でエージェントの操作内容が表示されます。範囲外のサイト遷移があれば早めに停止・修正します。
  4. Takeoverでログイン 認証が必要なサイトはTakeover modeで自分が入力。パスワードをプロンプトに書かない運用が安全です。
  5. 承認プロンプトを確認 購入・送信などは承認ダイアログが出ます。試験どおり、影響の大きい操作は必ず人が判断します。
  6. 成果物を検証 生成スライド・表・引用はファクトチェック後に社内利用。エージェント出力の無検証公開は避けてください。
ChatGPTのagent mode統合後もOpenAIエコシステム内で動作するイメージ
出典:OpenAI(ChatGPT)

ビジネスでの活用例

調査→資料化

  • 公開Webから競合Pricingを収集
  • deep research系の分析とスライド下書き
  • 出典URL付きレポートのたたき台

事務・調整の代行下書き

  • カレンダー連携後の会議準備メモ
  • 旅行・会食の候補リスト作成(予約確定は人が承認)
  • 経費・フォーム入力の下準備

データ更新・レポート

  • スプレッドシートへの数値追記(書式維持)
  • ダッシュボード截图からプレゼン素材へ
  • 定期レポートのスケジュール実行(agent mode)

いずれも業務アカウントへのログイン・顧客データの入力は情報セキュリティレビューが前提です。Operatorは便利さとリスクがセット——TF-0240の「実行権限設計」を実務に落とす典型例として扱ってください。

メリット・デメリット

メリット デメリット
APIのないWebサイトもGUI操作で扱える ブラウザ自動化はサイト変更・CAPTCHAで失敗しやすい
ChatGPT契約内で調査と実行が一体化(agent mode) 月間メッセージ上限があり、長タスクはすぐ枯渇
Takeover・承認・Watch modeなど安全設計が明示的 プロンプトインジェクション等、Web連携固有リスクがある
試験の「エージェント+人間承認」の具体例として学びやすい 製品名・UIが統合で変わり、古い情報との混同が起きやすい

Manus・Devin・通常ChatGPTとの比較

「Operatorを使うべきか」は、既にChatGPT契約があるか、独立サンドボックスが必要かで決まります。

項目 ChatGPT Operator(agent mode) Manus Devin 通常ChatGPT
提供元 OpenAI Monica.im / Meta Cognition OpenAI
主な形態 ChatGPT統合のWeb操作エージェント 独立サンドボックスの汎用エージェント 開発特化エージェント 対話型生成AI
実行環境 ChatGPTの仮想PC・ブラウザ Manus Sandbox+Cloud Browser Devin Cloud / CLI チャット+限定的ツール
技術の核 CUA(GUI操作モデル) 自律計画+VM/browser コード実装・テスト 大規模言語モデル
試験での覚え方 OpenAIのブラウザエージェント例 汎用エージェントの例 コーディングエージェントの例 生成AIアプリの代表

すでにChatGPTを業務利用しているならagent modeが導入しやすく、サンドボックスを別契約で持ちたいならManusリポジトリ実装ならDevin——という3分岐が整理しやすいです。

こんな人におすすめ

  • ChatGPT有料契約があり、Web操作まで任せたい人
  • 生成AIパスポートで「CUA」「人間承認」の具体例が欲しい受験生
  • APIのない社内Web・外部サービスの操作自動化を試したい担当者(権限レビュー後)
  • Operator→agent modeの変遷を試験の時事問題として押さえたい人

向いていないのは、無料だけで使いたい場合、ブラウザ操作を社外クラウドに載せられない場合、IDE内のコード補完だけ欲しい場合です。後者はGitHub CopilotCursorが適しています。

よくある質問

ChatGPT Operatorは今も単体で使えますか?

2025年7月以降、Operatorの能力はChatGPT内の「agent mode」に統合され、単体サイト operator.chatgpt.com は段階的に終了(sunset)されています(2026年6月時点)。新規利用はChatGPTのツールメニューからagent modeを選ぶ形が公式の案内です。

Operatorと通常のChatGPTチャットの違いは?

通常チャットは主にテキストで回答・下書きを生成します。Operator(agent mode)はクラウド上の仮想ブラウザや端末を使い、Webサイトのクリック・入力・ファイル操作まで含めてタスクを実行します。回答するだけでなく、ブラウザ上で行動する点が本質的な違いです。

CUAとは何ですか?

Computer-Using Agent(CUA)の略で、OpenAIがOperator向けに開発したモデルです。スクリーンショットでGUIを「見て」、マウス・キーボード相当の操作でWebページと対話します。GPT-4oの視覚能力と強化学習を組み合わせた構成が公式ブログで説明されています。

日本から使えますか?

2025年1月のOperator単体プレビューは米国のProユーザー限定でした。2025年7月のagent mode統合後はPlus・Pro・Team等の有料ユーザー向けに展開されていますが、欧州経済領域・スイス向けは公式に「準備中」とされていました。日本からの利用可否・上限はChatGPTのアカウント設定と公式ヘルプで最新を確認してください(2026年6月時点)。

ManusとChatGPT Operatorはどちらを選べばよいですか?

ChatGPT契約内でWeb操作エージェントを試すならOperator(agent mode)、独立したサンドボックスで調査・資料・Webアプリ試作まで横断したいならManus、という棲み分けが分かりやすいです。どちらもブラウザ自動化を含むため、機密データの取り扱いと人間承認の設計は必須です。