GAN (Red Generativa Adversaria)

Un framework de aprendizaje profundo que entrena dos redes - un generador y un discriminador - de manera adversaria para producir imágenes indistinguibles de las reales.

Una GAN (Generative Adversarial Network) es un framework generativo propuesto por Goodfellow et al. en 2014. Enfrenta un Generador contra un Discriminador, impulsando a ambos a mejorar mediante la competencia hasta que las imágenes generadas se vuelven indistinguibles de los datos reales.

Mecanismo de entrenamiento:

Generador (G): Toma ruido aleatorio z y produce imágenes sintéticas, con el objetivo de engañar al discriminador
Discriminador (D): Clasificador binario que juzga si las imágenes son reales o generadas
Juego minimax: G maximiza el error de D mientras D maximiza la precisión, impulsando la mejora
Equilibrio de Nash: Idealmente converge a D produciendo 0,5 para todas las entradas

Arquitecturas emblemáticas:

DCGAN (2015): Primera GAN práctica usando capas convolucionales
Pix2Pix (2016): GAN condicional para traducción de imágenes pareadas
CycleGAN (2017): Transferencia de estilo no pareada sin datos emparejados
StyleGAN (2018): Generador basado en estilo para rostros de alta resolución
StyleGAN3 (2021): Eliminó el aliasing para síntesis natural

Las aplicaciones incluyen superresolución (SRGAN, ESRGAN), inpainting y aumento de datos. La inestabilidad del entrenamiento (colapso de modo, desvanecimiento de gradientes) se aborda con distancia Wasserstein y normalización espectral. Los modelos de difusión ahora lideran en calidad, pero las GAN mantienen ventajas de velocidad para uso en tiempo real.

GAN (Red Generativa Adversaria)

Términos relacionados

Artículos relacionados