JA EN

GAN

読み: じーえーえぬ

生成器と識別器の 2 つのネットワークを敵対的に学習させ、本物と見分けがつかない画像を生成する深層学習フレームワーク。

GAN (Generative Adversarial Network / 敵対的生成ネットワーク) は、2014 年に Ian Goodfellow らが提案した生成モデルのフレームワークである。生成器 (Generator) と識別器 (Discriminator) という 2 つのニューラルネットワークを互いに競わせることで、訓練データの分布を学習し、本物と区別できない高品質な画像を生成する。

GAN の学習メカニズムは以下のように動作する。

代表的な GAN アーキテクチャの発展を示す。

応用は超解像 (SRGAN)、画像修復 (Inpainting)、データ拡張と多岐にわたる。学習の不安定性 (モード崩壊、勾配消失) が課題であり、Wasserstein 距離や Spectral Normalization などの安定化技法が開発されている。近年は拡散モデルが画像生成の主流になりつつあるが、リアルタイム推論では GAN の高速な生成速度が依然として有利である。

関連用語

関連記事