モデル・技術

CycleGANとは?ペアなしで翻訳する——循環の約束でドメインを結ぶGAN

読み:サイクルじぇーえぬ / 英:CycleGAN

更新日: 読了目安:約6分

CycleGANは、対応するペア画像がなくても、2つの画像ドメイン(馬↔シマウマ、昼↔夜など)の相互変換を学習するGANです。Pix2Pixが「線画と写真のペア」を要求するのに対し、CycleGANは「Aに行って戻れば元に戻る」循環の約束で整列を代用——本記事は損失式の暗記ではなく、そのペアなし翻訳の発想に焦点を当てます。

ペア問題の壁

画像変換の古典的課題は、「入力画像Aに対応する正解画像B」をペアで揃えることです。線画→彩色写真なら、同じ構図の線画と写真が必要になります(G-375のPix2Pix)。

しかし「馬の写真集」と「シマウマの写真集」には、1対1の対応がありません。同じ構図・同じポーズで撮ったペアを集めるのは現実的でない——CycleGANはこのペアなしの状況を想定します。

対応するペア画像がなくても、2つのドメイン間の画像変換を学習できるモデル。(G-376)

循環一貫性の直感

ペアがないとき、CycleGANは循環(Cycle)で整合性を担保します。

  1. 順変換 G — ドメインXの画像をドメインY風に変換
  2. 逆変換 F — ドメインYの画像をドメインX風に変換
  3. 循環損失 — X→Y→X と戻したとき、元の画像に近いべき
  4. GAN損失 — 変換結果が本物のY(またはX)らしく見えるよう識別器と競合

「馬→シマウマ風→馬に戻る」——この往復の約束が、ペアラベルの代わりに「変換が意味を保っている」手がかりになります。試験では循環損失の数式より、ペアなしでも学習できる理由が問われます。

ドメイン変換の例

ドメインXドメインY変換のイメージ
シマウマ模様・色調のスタイル変換(G-376の例)
昼の風景夜の風景照明・色調の変換
夏の写真冬の写真季節・天候の見た目変換
写真絵画風スタイル転送(style transfer)

いずれもドメイン変換——ある分布の画像を別分布らしく見せる——タスクです。Text-to-Imageの「文章から新規生成」とは目的が異なります。

Pix2Pix・DCGANとの違い

モデル必要データ主な用途試験
Pix2Pixペア画像(入力↔出力)線画→写真などG-375
CycleGAN2ドメインの非ペア集合馬↔シマウマ、昼↔夜G-376
DCGAN単一ドメインの画像ランダムノイズから新規生成G-374
GAN一般生成器と識別器の対戦G-373、HQ-0157

DCGANは「ゼロから画像を生む」、Pix2Pixは「ペアで翻訳する」、CycleGANは「ペアなしで翻訳する」——データの前提で整理するとすり替えを防げます。

試験で押さえるポイント

  • 定義 — ペア画像がなくても2ドメイン間の変換を学習(G-376)
  • 対比 — Pix2Pixはペア必須(G-375)
  • 系譜GANの画像変換系。拡散モデルではない
  • — 馬とシマウマ、昼と夜(試験解説の定番)

演習で確認する

G検定:G-376G-375G-374G-373

すり替えに注意

誤った説明正しい理解
CycleGAN=Pix2Pix非ペア vs ペア必須
CycleGAN=DCGANドメイン変換 vs ノイズからの新規生成
CycleGAN=教師あり学習ペアラベルなし。GANの枠組み
CycleGAN=CNNそのものGANベースの変換モデル名
CycleGAN=Text-to-Image画像→画像変換 vs テキスト→画像生成

よくある質問

CycleGANは何をするモデルですか?

対応するペア画像がなくても、2つのドメイン(例:馬とシマウマ、昼と夜)間の画像変換を学習できるGANです。Pix2Pixがペアデータを必要とするのに対し、ペアなし変換が特徴です(G-376)。

CycleGANとPix2Pixは同じですか?

いいえ。Pix2Pixは入力と出力のペア画像を使って変換を学習します(G-375)。CycleGANはペアがなくても、循環一貫性などの制約で2つのドメイン間の変換を学びます。

CycleGANは拡散モデルですか?

いいえ。CycleGANはGAN系の画像変換モデルです。近年のText-to-Imageで主流の拡散モデル(Stable Diffusionなど)とは別系統です。