GAN (生成对抗网络)
一种深度学习框架,以对抗方式训练生成器和判别器两个网络,生成与真实图像无法区分的图像。
GAN (Generative Adversarial Network) 是 Goodfellow 等人于 2014 年提出的生成框架。它让生成器与判别器相互对抗,通过竞争驱动双方改进,直到生成的图像与真实数据无法区分。
训练机制:
- 生成器 (G):接收随机噪声 z 并生成合成图像,目标是欺骗判别器
- 判别器 (D):二分类器,判断图像是真实的还是生成的
- 极小极大博弈:G 最大化 D 的错误率,D 最大化准确率,驱动双方改进
- 纳什均衡:理想情况下收敛到 D 对所有输入输出 0.5
里程碑架构:
DCGAN(2015):首个使用卷积层的实用 GANPix2Pix(2016):用于配对图像转换的条件 GANCycleGAN(2017):无需配对数据的非配对风格迁移StyleGAN(2018):基于风格的高分辨率人脸生成器StyleGAN3(2021):消除混叠实现自然合成
应用包括超分辨率 (SRGAN, ESRGAN)、图像修复和数据增强。训练不稳定性(模式崩溃、梯度消失)通过 Wasserstein 距离和谱归一化解决。扩散模型现在在质量上领先,但 GAN 在实时应用中保持速度优势。