GAN (Red Generativa Adversaria)
Un framework de aprendizaje profundo que entrena dos redes - un generador y un discriminador - de manera adversaria para producir imágenes indistinguibles de las reales.
Una GAN (Generative Adversarial Network) es un framework generativo propuesto por Goodfellow et al. en 2014. Enfrenta un Generador contra un Discriminador, impulsando a ambos a mejorar mediante la competencia hasta que las imágenes generadas se vuelven indistinguibles de los datos reales.
Mecanismo de entrenamiento:
- Generador (G): Toma ruido aleatorio z y produce imágenes sintéticas, con el objetivo de engañar al discriminador
- Discriminador (D): Clasificador binario que juzga si las imágenes son reales o generadas
- Juego minimax: G maximiza el error de D mientras D maximiza la precisión, impulsando la mejora
- Equilibrio de Nash: Idealmente converge a D produciendo 0,5 para todas las entradas
Arquitecturas emblemáticas:
DCGAN(2015): Primera GAN práctica usando capas convolucionalesPix2Pix(2016): GAN condicional para traducción de imágenes pareadasCycleGAN(2017): Transferencia de estilo no pareada sin datos emparejadosStyleGAN(2018): Generador basado en estilo para rostros de alta resoluciónStyleGAN3(2021): Eliminó el aliasing para síntesis natural
Las aplicaciones incluyen superresolución (SRGAN, ESRGAN), inpainting y aumento de datos. La inestabilidad del entrenamiento (colapso de modo, desvanecimiento de gradientes) se aborda con distancia Wasserstein y normalización espectral. Los modelos de difusión ahora lideran en calidad, pero las GAN mantienen ventajas de velocidad para uso en tiempo real.