RAGとは？試験で問われるポイントをわかりやすく解説

Q: RAGとは何の略ですか？

Retrieval-Augmented Generation（検索拡張生成）の略です。外部データを検索してから生成AIが回答する手法を指します。

Q: RAGとファインチューニングの違いは？

RAGは都度・外部データを参照して回答します。ファインチューニングはモデルの重みを追加学習で更新します。最新情報の反映にはRAGが向くことが多いです。

Q: RAGでハルシネーションは完全に防げますか？

いいえ。検索結果の品質やモデルの解釈により誤りは残ります。ハルシネーションを減らす手段のひとつです。

Q: どの試験で出題されますか？

G検定（生成AI応用）と生成AIパスポート（第3章・活用シーン）の両方で出題されます。

RAG（Retrieval-Augmented Generation／検索拡張生成）は、企業の生成AI活用で最も注目される技術のひとつです。外部の知識を検索してから回答を生成することで、LLM単体では持たない最新情報や社内文書を参照できます。G検定・生成AIパスポートの両方で出題されます。本記事では定義・仕組み・他手法との違い・試験の出題ポイントを整理します。詳細は用語辞典「RAG」もあわせてご覧ください。

RAGとは

RAGは、Retrieval（検索）とGeneration（生成）を組み合わせた手法です。ユーザーの質問に対し、まず関連する文書を検索し、その内容をプロンプトに含めてからLLMが回答を生成します。

日本語訳 検索拡張生成
目的 LLMの知識を外部データで補強し、正確性・最新性を高める
典型的な用途 社内文書QA、カスタマーサポート、社内ナレッジベースの活用

仕組みの流れ

文書の準備 社内マニュアル・FAQ・規程などをチャンク（断片）に分割
ベクトル化 各チャンクをエンベディング（数値ベクトル）に変換し、ベクトルDBに格納
検索（Retrieval） ユーザーの質問もベクトル化し、意味的に近いチャンクを検索
生成（Generation） 検索結果をプロンプトに含め、LLMが回答を生成
（任意）再ランキング 検索結果の精度を高めるため、関連度の再評価を行う場合もある

関連技術としてチャンキング（文書分割）やセマンティック検索も問われることがあります。

ファインチューニングとの違い

試験で最も頻出する比較です。

観点	RAG	ファインチューニング
仕組み	外部データを検索して参照	モデルの重みを追加学習で更新
最新情報	DBを更新すれば反映しやすい	再学習が必要
コスト	比較的導入しやすい	学習コスト・データ準備が大きい
向いている用途	社内文書QA、FAQ対応	特定ドメインの文体・タスクに特化

両者は排他的ではなく、組み合わせて使うこともあります。

メリットと限界

メリット：根拠の明示 参照した文書を示せるため、回答の信頼性が上がる
メリット：ハルシネーションの軽減 外部データに基づく回答で誤りが減る（完全防止ではない）
メリット：社内ナレッジの活用 LLMの学習データにない情報を参照できる
限界：検索品質への依存 関連文書が見つからないと誤回答になりやすい
限界：データ整備が必要 文書の品質・更新・チャンク設計が精度に影響
限界：完全な正確性は保証されない モデルが検索結果を誤解釈する可能性がある

試験での出題ポイント

試験	出題の傾向	演習
G検定	生成AI応用、社内文書活用の文脈でRAGの定義・目的が問われる	domain-05
生成AIパスポート	第3章（活用シーン）で頻出。FTとの違い、導入メリットが問われる	第3章

略称と意味 Retrieval-Augmented Generation の意味を選ぶ
用途の選択 「社内マニュアルを参照して回答」→RAGが適切
誤解の排除 「RAGで100%正確」「RAGはモデルを再学習する」などの誤り

一問一答で定着させる

生成AIパスポート第3章 · プロンプトエンジニアリングの要点

よくある質問

RAGとは何の略ですか？

Retrieval-Augmented Generation（検索拡張生成）です。用語辞典で詳しく解説しています。

RAGとファインチューニングの違いは？

RAGは外部データを都度参照、ファインチューニングはモデルを追加学習します。最新情報の反映にはRAGが向くことが多いです。

RAGでハルシネーションは完全に防げますか？

いいえ。減らす手段のひとつです。ハルシネーションの解説も参照してください。

どの試験で出題されますか？

G検定（生成AI応用）と生成AIパスポート（第3章）の両方です。