自己整合性(Self-Consistency)は、同じ問題に対して複数の推論経路(答えの候補)を生成し、最も多く現れた結論を採用するプロンプト技法です。本記事はChain-of-Thoughtの書き方ではなく、「1本の推論」から「多数決」へ——精度を上げる考え方——に焦点を当てます。
試験で問われる見方
専用の一問一答IDは少ないですが、プロンプトエンジニアリングの技法の一つとして、複数回生成して一貫した答えを選ぶイメージで押さえます。
×:自己整合性=アライメント(人間の価値への整合)。×:自己整合性=RAGや外部検索。×:多数決すればハルシネーションが必ず消える。
自己整合性とは
1回の生成では、サンプリングのゆらぎで誤答になることがあります。自己整合性は、同じ質問を複数回(異なる推論パスで)解かせ、答えの多数決を取ることで、単発より正答しやすくする手法です(研究では算数・論理問題で効果が報告されています)。
「自分(モデル)の複数の答えの一貫性(consistency)を見る」という意味合いの名称です。
処理の流れ
- 同じプロンプト(またはCoT付き)で複数回生成する
- 各回の最終答え(数値・選択肢・Yes/No等)を抽出する
- 最多票の答えを採用する(同票ならルールで決める)
- 必要なら採用答えの推論過程を人が確認する
多様な経路を得るため、温度をやや高めにする、シードを変えるなどの工夫が使われます。
CoTとの組み合わせ
| 技法 | やること |
|---|---|
| Chain-of-Thought | 1回の生成内で段階的推論を促す |
| 自己整合性(本記事) | 複数回の生成結果を多数決する |
論文・実装ではCoTで複数の推論チェーンを生成→自己整合性で答えを選ぶという組み合わせが典型です。どちらか一方だけ、というわけではありません。
コストと限界
混同しやすい用語
| 用語 | 違い |
|---|---|
| アライメント | モデル調整・価値整合の広い概念(アライメント) |
| アンサンブル学習 | 複数モデルの組み合わせ(機械学習一般) |
| 自己回帰 | トークンを順に生成するモデルの性質(GPT) |
| ファクトチェック | 外部事実との照合(ハルシネーション対策) |
よくある質問
何回生成すればよい?
研究では5〜10回などが例にされます。試験では回数の暗記より「複数経路の多数決」という考え方で十分です。
業務で使える?
分類・抽出・数値判断など答えが离散値のタスク向きです。長文生成にはコスト対効果が低いことが多いです。
プロンプトエンジニアリングの一部?
はい。プロンプトエンジニアリングの技法ツールボックスの一つです。