GAN(Generative Adversarial Network/敵対的生成ネットワーク)は、生成器(Generator)と識別器(Discriminator)を競わせながら、本物らしいデータを生成する生成AIの手法です。本記事は拡散モデルの解説ではなく、二つのネットワークの役割分担——試験で最も問われる構造——に焦点を当てます。
試験で問われる見方
定義の核:「生成器と識別器を競わせながら生成性能を高めるモデル」(HQ-0157、G-378のA)。
生成器・識別器の役割の入れ替えが誤答になりやすいです(HQ-0303)。生成器が「本物らしいデータを作る」、識別器が「本物か生成物かを見分ける」——この対応を確認してください。
G検定では、(あ)偽物生成(い)本物判定の組み合わせ問題(G-373)、識別器が常に多クラス分類器であるという説明は×(TF-152)も出ます。
GANとは
GANは2014年頃に提案され、画像生成の品質向上に大きく貢献した手法です。二つのネットワークがミニマックスゲームのように学習し、生成器は識別器を騙そう、識別器は見抜こう、という競争で性能が上がります。
近年のText-to-Imageでは拡散モデルが主流になりつつありますが、試験ではGANと拡散の両方が生成モデルの代表として問われます。
生成器と識別器
| 構成要素 | 役割 | 試験での言い換え |
|---|---|---|
| 生成器(G) | ノイズなどから偽データを生成 | 「本物らしいデータを作ろうとする側」 |
| 識別器(D) | 入力が本物か生成物か判定 | 「見分けようとする側」 |
HQ-0157の誤答では、GAN全体の定義を生成器や識別器単体の説明とすり替えています。主語が「GAN」か「識別器」かを読み分けてください。
拡散モデルとの位置づけ
GAN
対抗学習。生成器 vs 識別器
拡散モデル
ノイズ付加・除去の段階的生成
どちらもG-378のように「データ生成モデル」の適切な説明として並びます。ディープフェイクの早期事例とGANの関連も知識として出ることがあります(ディープフェイク)。
よくある質問
GANと拡散モデル、どちらが新しい主流?
高品質なText-to-Imageでは拡散が主流です。試験では両方の定義が必要です。
識別器はクラス名を当てる?
基本GANでは二値判定。多クラス分類器である必要はない(TF-152)。
GANはテキスト生成にも使える?
原理上は可能ですが、試験では画像生成の文脈で出ることが多いです。テキストは主にLLM。