生成AI活用

RAG(検索拡張生成)とは?仕組み・メリット・限界

読み:らぐ / 英:Retrieval-Augmented Generation

更新日: 読了目安:約6分

RAG(Retrieval-Augmented Generation/検索拡張生成)は、LLMが持たない社内文書・最新情報を、検索で取り込んでから回答する構成です。本記事はハルシネーションの心理ではなく、システムのパイプライン——何を検索し、どう生成に渡すか——に焦点を当てます。試験では「正確性を100%保証する」といった言い過ぎが×になりやすい点も押さえます。

試験で問われる見方

G検定・生成AIパスポートとも、RAGは「外部情報を検索し、生成の入力に加える」という定義が骨格です。一方で「RAGがあれば検証不要」「誤情報が検索にあっても必ず正答」は×です。

演習で確認する

G検定:TF-174(定義)TF-175(限界)

生成AIパスポート:TF-0172(定義)TF-0171(100%正確は×)TF-0228(略称)

RAGとは

RAGは、ユーザーの質問に対してまず関連文書を検索(Retrieval)し、得られた抜粋をプロンプトに含めたうえでLLMが回答を生成(Generation)するパターンです。モデル単体の学習データだけに頼らず、根拠のある参照を足すのが目的です。

社内FAQ、マニュアル、議事録、製品仕様など、閉じたナレッジをチャットで引けるようにする用途でよく採用されます。生成AIの業務活用では、いま最も一般的なアーキテクチャのひとつです。

処理の流れ(4ステップ)

実装の細部は製品によりますが、概念として次の流れを覚えると試験・設計の両方に使えます。

  • 1. インデックス化(事前準備)

    チャンキングで文書を分割し、埋め込みモデルでベクトル化してベクトルDBに格納。

  • 2. 検索(Retrieval)

    ベクトル検索セマンティック検索で、質問に意味的に近いチャンクを上位k件取得。

  • 3. 拡張(Augment)

    検索結果をプロンプトに挿入。「以下の資料に基づいて答えよ」など指示とセット。

  • 4. 生成(Generation)

    LLMが参照文脈を踏まえて回答。出典表示を付ける製品もある。

検索が外れる(関係ない段落を拾う)と、ハルシネーションに似た誤回答が起きます。チャンク設計と検索精度が品質の鍵です。チャンク・RAG・ベクトルDBの定義すり替えに注意(HQ-0370HQ-0371)。

導入が向く場面

シーン RAGが効きやすい理由
社内規程・手順の質問応答 根拠文書を明示しやすい
学習データ以降の情報 モデル再学習なしで資料を更新できる
顧客サポートのナレッジ検索 FAQ・チケット履歴を検索対象にできる
開発者向けドキュメントQA API仕様など長文をチャンク検索

ファインチューニングとの違い

比較 RAG ファインチューニング
知識の更新 インデックスの差し替えで比較的容易 再学習が必要になりがち
根拠の提示 参照文書を示しやすい モデル内部に埋もれやすい
コスト・難易度 検索基盤の構築が中心 学習データ整備・GPUコスト
試験の注意 「検索+生成」の説明 「重みの追加学習」と混同しない

限界と運用上の注意

  • 検索ミス — 関係ない段落を拾うと誤回答の元になる
  • 資料の誤り — インデックスが誤情報なら出力も誤る(TF-175
  • プロンプトインジェクション — 取り込んだPDFに悪意ある指示が含まれるリスク(TF-204
  • 人の確認は依然必要 — 100%正確の保証はない(TF-0171

AIエージェントと組み合わせると、検索・API呼び出しを自律的に繰り返す構成にも発展します。設計が複雑になるほど、ログと権限管理が重要になります。

よくある質問

RAGとは何の略?

Retrieval-Augmented Generation(検索拡張生成)です。TF-0228も参照してください。

RAGを入れれば回答は100%正確になる?

いいえ。根拠性は高めやすいですが、検索・生成のどちらでも誤りは起こり得ます。

RAGとハルシネーション対策の関係は?

RAGは幻覚を減らす手段のひとつですが、消滅させる魔法ではありません。詳細はハルシネーションを参照。

生成AIエンジニアの仕事と関係ある?

RAGパイプラインの設計・評価は実務の中心タスクのひとつです。生成AIエンジニアも参照してください。