AIエージェント(AI Agent)は、単なる質問応答ではなく、目標に向けて計画し、ツールを使いながらタスクを進めるAIの構成です。本記事はRAGの検索パイプラインやハルシネーションの定義ではなく、「誰が・何を・どこまで自律的に実行するか」というオーケストレーションの視点で整理します。強化学習の「エージェント」とは文脈が異なることも試験で区別します。
試験で問われる見方
生成AIパスポートでは、計画・ツール利用・自律性がキーワードです。また、失敗時のログ記録は推奨され、「ログを残すと調査が難しくなるから記録しない」は×です。
AIエージェントとは
一般的な説明として、AIエージェントは与えられた目標(例:「今週の競合ニュースをまとめて」)に対し、LLMが手順を分解し、必要に応じて外部ツール(検索、カレンダー、コード実行、社内APIなど)を呼び出しながら進める仕組みです。
1回のプロンプトで完結するのではなく、複数ステップのループになる点が、近年の「エージェント」ブームの本質です。
思考と行動のループ
製品により名称は異なりますが、概念として次のサイクルが繰り返されます。
- 理解 — ユーザーの目標と制約を把握
- 計画 — サブタスクに分解(例:検索→要約→表作成)
- 行動 — ツールを実行(RAG検索、API、ファイル操作)
- 観察 — 結果を読み、次の一手を決める
- 完了 or 再試行 — 目標達成までループ、または人に確認
チャットボットとの違い
| 比較 | チャットボット(対話型) | AIエージェント |
|---|---|---|
| 基本動作 | 入力に対し回答を返す | 目標達成まで複数手順を実行 |
| 外部連携 | なし〜限定的 | ツール・API呼び出しが前提になりやすい |
| 自律性 | 低い(都度の指示) | 中〜高(計画に沿って進める) |
| リスク | 誤回答・情報漏洩 | 上記に加え、誤ったAPI操作・権限逸脱 |
ChatGPTもエージェント機能を追加しており、「チャット」と「エージェント」の境界は製品上あいまいになっています。試験では能力の説明文で判別します。
ツール連携の例
検索・RAG
社内文書やWebを引いてから回答を組み立てる。
コード実行
データ分析やファイル変換を自動で試行する。
業務API
CRM登録、チケット起票、在庫照会など。
マルチエージェント
調査役・執筆役など役割分担(高度な構成)。
ツールが増えるほど、権限の最小化(読み取り専用、承認フロー)が重要です。
運用・ガバナンス
- ログ・監査証跡 — 何を実行したか追えるようにする(TF-0270)
- 人の承認ポイント — 送信・決済・削除などは最終確認
- プロンプトインジェクション対策 — 外部データ経由の悪意ある指示(TF-204)
- 失敗時のフォールバック — 無限ループやコスト暴走を防ぐ上限設定
キャリア面では、エージェント設計は生成AIエンジニアやプロンプトエンジニアの実務領域と重なります。