ハルシネーション対策は、ハルシネーション(事実誤りの出力)をゼロにはできなくても、リスクを下げるための技法・運用の総称です。本記事は現象の定義ではなく、多層の対策スタック——どの層で何をするか——に焦点を当てます。「RAGを入れれば完璧」は試験では×です。
試験で問われる見方
「生成AIの提案資料は必ず正確だから根拠確認不要」は×(TF-0452)。「断定的な口調だから正しい」も×(TF-0256)。対策の本質は技術+人の検証の組み合わせです。
対策のゴール設定
実務・試験とも、目標は「幻覚ゼロ」ではなく「許容可能なリスク」です。医療・法務・対外公開ほど、要求される確認レベルが上がります。対策はユースケースごとに設計します。
4層の対策スタック
下から上に積み上げるイメージで整理します(すべてを常に実施する必要はありません)。
-
層1:プロンプト・推論設定
「不明ならわからないと答える」、温度を下げる、出力形式を固定(プロンプト・プロンプトエンジニアリング)。
-
層2:根拠の付与(RAG・検索)
参照文書を渡して根拠性を高める(RAG)。検索ミスには注意。
-
層3:自動検証
引用の有無チェック、数値の再計算、別モデルによる批判的レビュー、ルールベース検証。
-
層4:人のファクトチェック
一次情報・複数ソースで確認(TF-0257)。
RAGは万能ではない
RAGは対策の有力手段ですが、幻覚を完全に消すものではありません(TF-175、TF-0171)。検索結果の誤り、無関係な段落の参照、モデルが資料を無視して捏造する、といった失敗モードがあります。
| 失敗モード | 補助対策 |
|---|---|
| 検索ヒットが外れる | チャンク設計、リランキング |
| 資料が誤っている | ナレッジの品質管理 |
| 引用を無視して生成 | 出典必須のプロンプト、後段検証 |
人による確認(最後の層)
人間中心のAIの考え方どおり、重要な判断は人が担います。チェックの優先度は次のとおりが実務的です。
- 数値・日付・固有名詞
- 法規・契約・医療に関わる記述
- 対外公開・顧客向け資料
- 社外秘・個人情報の有無
評価・監視
本番運用では、対策の効果を継続的に測ることが重要です(AIガバナンスの監視・改善と接続)。
ベンチマーク
社内FAQで正答率・引用一致率を測定
ユーザーフィードバック
誤回答報告の収集
回帰テスト
モデル更新後に幻覚率が悪化していないか