RAG(Retrieval-Augmented Generation/検索拡張生成)は、企業の生成AI活用で最も注目される技術のひとつです。外部の知識を検索してから回答を生成することで、LLM単体では持たない最新情報や社内文書を参照できます。G検定・生成AIパスポートの両方で出題されます。本記事では定義・仕組み・他手法との違い・試験の出題ポイントを整理します。詳細は用語辞典「RAG」もあわせてご覧ください。
RAGとは
RAGは、Retrieval(検索)とGeneration(生成)を組み合わせた手法です。ユーザーの質問に対し、まず関連する文書を検索し、その内容をプロンプトに含めてからLLMが回答を生成します。
- 日本語訳 検索拡張生成
- 目的 LLMの知識を外部データで補強し、正確性・最新性を高める
- 典型的な用途 社内文書QA、カスタマーサポート、社内ナレッジベースの活用
仕組みの流れ
ファインチューニングとの違い
試験で最も頻出する比較です。
| 観点 | RAG | ファインチューニング |
|---|---|---|
| 仕組み | 外部データを検索して参照 | モデルの重みを追加学習で更新 |
| 最新情報 | DBを更新すれば反映しやすい | 再学習が必要 |
| コスト | 比較的導入しやすい | 学習コスト・データ準備が大きい |
| 向いている用途 | 社内文書QA、FAQ対応 | 特定ドメインの文体・タスクに特化 |
両者は排他的ではなく、組み合わせて使うこともあります。
メリットと限界
- メリット:根拠の明示 参照した文書を示せるため、回答の信頼性が上がる
- メリット:ハルシネーションの軽減 外部データに基づく回答で誤りが減る(完全防止ではない)
- メリット:社内ナレッジの活用 LLMの学習データにない情報を参照できる
- 限界:検索品質への依存 関連文書が見つからないと誤回答になりやすい
- 限界:データ整備が必要 文書の品質・更新・チャンク設計が精度に影響
- 限界:完全な正確性は保証されない モデルが検索結果を誤解釈する可能性がある
試験での出題ポイント
| 試験 | 出題の傾向 | 演習 |
|---|---|---|
| G検定 | 生成AI応用、社内文書活用の文脈でRAGの定義・目的が問われる | domain-05 |
| 生成AIパスポート | 第3章(活用シーン)で頻出。FTとの違い、導入メリットが問われる | 第3章 |
- 略称と意味 Retrieval-Augmented Generation の意味を選ぶ
- 用途の選択 「社内マニュアルを参照して回答」→RAGが適切
- 誤解の排除 「RAGで100%正確」「RAGはモデルを再学習する」などの誤り
一問一答で定着させる
よくある質問
RAGとは何の略ですか?
Retrieval-Augmented Generation(検索拡張生成)です。用語辞典で詳しく解説しています。
RAGとファインチューニングの違いは?
RAGは外部データを都度参照、ファインチューニングはモデルを追加学習します。最新情報の反映にはRAGが向くことが多いです。
RAGでハルシネーションは完全に防げますか?
いいえ。減らす手段のひとつです。ハルシネーションの解説も参照してください。
どの試験で出題されますか?
G検定(生成AI応用)と生成AIパスポート(第3章)の両方です。