生成AI活用

自己整合性とは?Self-Consistency・多数決推論

読み:じこせいごうせい / 英:Self-Consistency

更新日: 読了目安:約6分

自己整合性(Self-Consistency)は、同じ問題に対して複数の推論経路(答えの候補)を生成し、最も多く現れた結論を採用するプロンプト技法です。本記事はChain-of-Thoughtの書き方ではなく、「1本の推論」から「多数決」へ——精度を上げる考え方——に焦点を当てます。

試験で問われる見方

専用の一問一答IDは少ないですが、プロンプトエンジニアリングの技法の一つとして、複数回生成して一貫した答えを選ぶイメージで押さえます。

×:自己整合性=アライメント(人間の価値への整合)。×:自己整合性=RAGや外部検索。×:多数決すればハルシネーションが必ず消える

関連演習

TF-0460(説明できる≠正確)TF-171 — 技法を使っても最終確認は必要

CoTG-385(Few-shot)

自己整合性とは

1回の生成では、サンプリングのゆらぎで誤答になることがあります。自己整合性は、同じ質問を複数回(異なる推論パスで)解かせ、答えの多数決を取ることで、単発より正答しやすくする手法です(研究では算数・論理問題で効果が報告されています)。

「自分(モデル)の複数の答えの一貫性(consistency)を見る」という意味合いの名称です。

処理の流れ

  1. 同じプロンプト(またはCoT付き)で複数回生成する
  2. 各回の最終答え(数値・選択肢・Yes/No等)を抽出する
  3. 最多票の答えを採用する(同票ならルールで決める)
  4. 必要なら採用答えの推論過程を人が確認する

多様な経路を得るため、温度をやや高めにする、シードを変えるなどの工夫が使われます。

CoTとの組み合わせ

技法やること
Chain-of-Thought1回の生成内で段階的推論を促す
自己整合性(本記事)複数回の生成結果を多数決する

論文・実装ではCoTで複数の推論チェーンを生成→自己整合性で答えを選ぶという組み合わせが典型です。どちらか一方だけ、というわけではありません。

コストと限界

  • コスト — 生成回数×トークン。API料金・遅延が増える
  • 誤答の連鎖 — 全経路が同じ誤りなら多数決でも誤る
  • 主観的タスク — 正解が一意でない文章生成には向きにくい
  • 検証は依然必要TF-0460のとおり、整合した誤推論がありうる

混同しやすい用語

用語違い
アライメントモデル調整・価値整合の広い概念(アライメント
アンサンブル学習複数モデルの組み合わせ(機械学習一般)
自己回帰トークンを順に生成するモデルの性質(GPT
ファクトチェック外部事実との照合(ハルシネーション対策

よくある質問

何回生成すればよい?

研究では5〜10回などが例にされます。試験では回数の暗記より「複数経路の多数決」という考え方で十分です。

業務で使える?

分類・抽出・数値判断など答えが离散値のタスク向きです。長文生成にはコスト対効果が低いことが多いです。

プロンプトエンジニアリングの一部?

はい。プロンプトエンジニアリングの技法ツールボックスの一つです。