生成AI活用

ハルシネーション対策とは?減らす技法と限界

読み:はるしねーしょんたいさく / 英:Hallucination Mitigation

更新日: 読了目安:約6分

ハルシネーション対策は、ハルシネーション(事実誤りの出力)をゼロにはできなくても、リスクを下げるための技法・運用の総称です。本記事は現象の定義ではなく、多層の対策スタック——どの層で何をするか——に焦点を当てます。「RAGを入れれば完璧」は試験では×です。

試験で問われる見方

「生成AIの提案資料は必ず正確だから根拠確認不要」は×(TF-0452)。「断定的な口調だから正しい」も×(TF-0256)。対策の本質は技術+人の検証の組み合わせです。

演習で確認する

生成AIパスポート:TF-0452TF-0257(ファクトチェック)TF-0390(根拠の明示)

G検定:TF-171TF-175(RAGの限界)

対策のゴール設定

実務・試験とも、目標は「幻覚ゼロ」ではなく「許容可能なリスク」です。医療・法務・対外公開ほど、要求される確認レベルが上がります。対策はユースケースごとに設計します。

4層の対策スタック

下から上に積み上げるイメージで整理します(すべてを常に実施する必要はありません)。

  • 層1:プロンプト・推論設定

    「不明ならわからないと答える」、温度を下げる、出力形式を固定(プロンプトプロンプトエンジニアリング)。

  • 層2:根拠の付与(RAG・検索)

    参照文書を渡して根拠性を高める(RAG)。検索ミスには注意。

  • 層3:自動検証

    引用の有無チェック、数値の再計算、別モデルによる批判的レビュー、ルールベース検証。

  • 層4:人のファクトチェック

    一次情報・複数ソースで確認(TF-0257)。

RAGは万能ではない

RAGは対策の有力手段ですが、幻覚を完全に消すものではありませんTF-175TF-0171)。検索結果の誤り、無関係な段落の参照、モデルが資料を無視して捏造する、といった失敗モードがあります。

失敗モード 補助対策
検索ヒットが外れる チャンク設計、リランキング
資料が誤っている ナレッジの品質管理
引用を無視して生成 出典必須のプロンプト、後段検証

人による確認(最後の層)

人間中心のAIの考え方どおり、重要な判断は人が担います。チェックの優先度は次のとおりが実務的です。

  1. 数値・日付・固有名詞
  2. 法規・契約・医療に関わる記述
  3. 対外公開・顧客向け資料
  4. 社外秘・個人情報の有無

評価・監視

本番運用では、対策の効果を継続的に測ることが重要です(AIガバナンスの監視・改善と接続)。

ベンチマーク

社内FAQで正答率・引用一致率を測定

ユーザーフィードバック

誤回答報告の収集

回帰テスト

モデル更新後に幻覚率が悪化していないか

よくある質問

ハルシネーションは完全になくせる?

現時点では困難です。対策はリスク低減が目的です。

RAGだけで十分?

不十分です。人の確認や評価と組み合わせます(RAG記事も参照)。

ハルシネーションとの記事の違いは?

ハルシネーションは現象の説明、本記事は対策の整理です。