用語解説

RAGとは?試験で問われるポイントをわかりやすく解説

定義 · 仕組み · ファインチューニングとの違い · 出題ポイント

ノートでRAGの概念を整理して学習する様子
出典:Unsplash(Jan Kahánek)
更新日: 読了目安:約8分

RAG(Retrieval-Augmented Generation/検索拡張生成)は、企業の生成AI活用で最も注目される技術のひとつです。外部の知識を検索してから回答を生成することで、LLM単体では持たない最新情報や社内文書を参照できます。G検定・生成AIパスポートの両方で出題されます。本記事では定義・仕組み・他手法との違い・試験の出題ポイントを整理します。詳細は用語辞典「RAG」もあわせてご覧ください。

RAGとは

RAGは、Retrieval(検索)Generation(生成)を組み合わせた手法です。ユーザーの質問に対し、まず関連する文書を検索し、その内容をプロンプトに含めてからLLMが回答を生成します。

  • 日本語訳 検索拡張生成
  • 目的 LLMの知識を外部データで補強し、正確性・最新性を高める
  • 典型的な用途 社内文書QA、カスタマーサポート、社内ナレッジベースの活用

仕組みの流れ

  1. 文書の準備 社内マニュアル・FAQ・規程などをチャンク(断片)に分割
  2. ベクトル化 各チャンクをエンベディング(数値ベクトル)に変換し、ベクトルDBに格納
  3. 検索(Retrieval) ユーザーの質問もベクトル化し、意味的に近いチャンクを検索
  4. 生成(Generation) 検索結果をプロンプトに含め、LLMが回答を生成
  5. (任意)再ランキング 検索結果の精度を高めるため、関連度の再評価を行う場合もある

関連技術としてチャンキング(文書分割)やセマンティック検索も問われることがあります。

ファインチューニングとの違い

試験で最も頻出する比較です。

観点 RAG ファインチューニング
仕組み 外部データを検索して参照 モデルの重みを追加学習で更新
最新情報 DBを更新すれば反映しやすい 再学習が必要
コスト 比較的導入しやすい 学習コスト・データ準備が大きい
向いている用途 社内文書QA、FAQ対応 特定ドメインの文体・タスクに特化

両者は排他的ではなく、組み合わせて使うこともあります。

メリットと限界

  • メリット:根拠の明示 参照した文書を示せるため、回答の信頼性が上がる
  • メリット:ハルシネーションの軽減 外部データに基づく回答で誤りが減る(完全防止ではない)
  • メリット:社内ナレッジの活用 LLMの学習データにない情報を参照できる
  • 限界:検索品質への依存 関連文書が見つからないと誤回答になりやすい
  • 限界:データ整備が必要 文書の品質・更新・チャンク設計が精度に影響
  • 限界:完全な正確性は保証されない モデルが検索結果を誤解釈する可能性がある

試験での出題ポイント

試験 出題の傾向 演習
G検定 生成AI応用、社内文書活用の文脈でRAGの定義・目的が問われる domain-05
生成AIパスポート 第3章(活用シーン)で頻出。FTとの違い、導入メリットが問われる 第3章
  • 略称と意味 Retrieval-Augmented Generation の意味を選ぶ
  • 用途の選択 「社内マニュアルを参照して回答」→RAGが適切
  • 誤解の排除 「RAGで100%正確」「RAGはモデルを再学習する」などの誤り

よくある質問

RAGとは何の略ですか?

Retrieval-Augmented Generation(検索拡張生成)です。用語辞典で詳しく解説しています。

RAGとファインチューニングの違いは?

RAGは外部データを都度参照、ファインチューニングはモデルを追加学習します。最新情報の反映にはRAGが向くことが多いです。

RAGでハルシネーションは完全に防げますか?

いいえ。減らす手段のひとつです。ハルシネーションの解説も参照してください。

どの試験で出題されますか?

G検定(生成AI応用)と生成AIパスポート(第3章)の両方です。