モデル・技術

GANとは?敵対的生成ネットワーク・生成器と識別器

読み:じぇーえーえぬ / 英:GAN(Generative Adversarial Network)

更新日: 読了目安:約6分

GAN(Generative Adversarial Network/敵対的生成ネットワーク)は、生成器(Generator)識別器(Discriminator)を競わせながら、本物らしいデータを生成する生成AIの手法です。本記事は拡散モデルの解説ではなく、二つのネットワークの役割分担——試験で最も問われる構造——に焦点を当てます。

試験で問われる見方

定義の核:「生成器と識別器を競わせながら生成性能を高めるモデル」HQ-0157G-378のA)。

生成器・識別器の役割の入れ替えが誤答になりやすいです(HQ-0303)。生成器が「本物らしいデータを作る」、識別器が「本物か生成物かを見分ける」——この対応を確認してください。

G検定では、(あ)偽物生成(い)本物判定の組み合わせ問題(G-373)、識別器が常に多クラス分類器であるという説明は×(TF-152)も出ます。

演習で確認する

生成AIパスポート:HQ-0157HQ-0303

G検定:G-373G-378TF-152

GANとは

GANは2014年頃に提案され、画像生成の品質向上に大きく貢献した手法です。二つのネットワークがミニマックスゲームのように学習し、生成器は識別器を騙そう、識別器は見抜こう、という競争で性能が上がります。

近年のText-to-Imageでは拡散モデルが主流になりつつありますが、試験ではGANと拡散の両方が生成モデルの代表として問われます。

生成器と識別器

構成要素役割試験での言い換え
生成器(G)ノイズなどから偽データを生成「本物らしいデータを作ろうとする側」
識別器(D)入力が本物か生成物か判定「見分けようとする側」

HQ-0157の誤答では、GAN全体の定義を生成器や識別器単体の説明とすり替えています。主語が「GAN」か「識別器」かを読み分けてください。

拡散モデルとの位置づけ

GAN

対抗学習。生成器 vs 識別器

拡散モデル

ノイズ付加・除去の段階的生成

どちらもG-378のように「データ生成モデル」の適切な説明として並びます。ディープフェイクの早期事例とGANの関連も知識として出ることがあります(ディープフェイク)。

よくある質問

GANと拡散モデル、どちらが新しい主流?

高品質なText-to-Imageでは拡散が主流です。試験では両方の定義が必要です。

識別器はクラス名を当てる?

基本GANでは二値判定。多クラス分類器である必要はない(TF-152)。

GANはテキスト生成にも使える?

原理上は可能ですが、試験では画像生成の文脈で出ることが多いです。テキストは主にLLM