自己整合性とアライメントは同じ？

違う。自己整合性は推論を複数回して多数決する技法。アライメントはAIの目的を人間の意図に合わせること。

自己整合性とは？Self-Consistency・多数決推論

自己整合性（Self-Consistency）は、同じ問題に対して複数の推論経路（答えの候補）を生成し、最も多く現れた結論を採用するプロンプト技法です。本記事はChain-of-Thoughtの書き方ではなく、「1本の推論」から「多数決」へ——精度を上げる考え方——に焦点を当てます。

試験で問われる見方

専用の一問一答IDは少ないですが、プロンプトエンジニアリングの技法の一つとして、複数回生成して一貫した答えを選ぶイメージで押さえます。

×：自己整合性＝アライメント（人間の価値への整合）。×：自己整合性＝RAGや外部検索。×：多数決すればハルシネーションが必ず消える。

関連演習

TF-0460（説明できる≠正確）、TF-171 — 技法を使っても最終確認は必要

CoT、G-385（Few-shot）

自己整合性とは

1回の生成では、サンプリングのゆらぎで誤答になることがあります。自己整合性は、同じ質問を複数回（異なる推論パスで）解かせ、答えの多数決を取ることで、単発より正答しやすくする手法です（研究では算数・論理問題で効果が報告されています）。

「自分（モデル）の複数の答えの一貫性（consistency）を見る」という意味合いの名称です。

処理の流れ

同じプロンプト（またはCoT付き）で複数回生成する
各回の最終答え（数値・選択肢・Yes/No等）を抽出する
最多票の答えを採用する（同票ならルールで決める）
必要なら採用答えの推論過程を人が確認する

多様な経路を得るため、温度をやや高めにする、シードを変えるなどの工夫が使われます。

CoTとの組み合わせ

技法	やること
Chain-of-Thought	1回の生成内で段階的推論を促す
自己整合性（本記事）	複数回の生成結果を多数決する

論文・実装ではCoTで複数の推論チェーンを生成→自己整合性で答えを選ぶという組み合わせが典型です。どちらか一方だけ、というわけではありません。

コストと限界

コスト — 生成回数×トークン。API料金・遅延が増える
誤答の連鎖 — 全経路が同じ誤りなら多数決でも誤る
主観的タスク — 正解が一意でない文章生成には向きにくい
検証は依然必要 — TF-0460のとおり、整合した誤推論がありうる

すり替えに注意

誤った説明	正しい理解
自己整合性＝アライメント	多数決推論 vs 価値整合（アライメント）
自己整合性＝RAG	複数生成の多数決 vs 外部検索
多数決でハルシネーション消滅	全経路が同じ誤りなら誤る（TF-0460）
自己整合性＝自己回帰	推論技法 vs モデルの生成性質（GPT）

よくある質問

何回生成すればよい？

研究では5〜10回などが例にされます。試験では回数の暗記より「複数経路の多数決」という考え方で十分です。

業務で使える？

分類・抽出・数値判断など答えが离散値のタスク向きです。長文生成にはコスト対効果が低いことが多いです。

プロンプトエンジニアリングの一部？

はい。プロンプトエンジニアリングの技法ツールボックスの一つです。