Aumento de datos
Una técnica que incrementa artificialmente la diversidad de los datos de entrenamiento aplicando transformaciones como rotación, volteo y variación de color, mejorando la generalización del modelo y reduciendo el sobreajuste.
El aumento de datos (Data Augmentation) aplica transformaciones geométricas, fotométricas y de otro tipo a las muestras de entrenamiento existentes, expandiendo artificialmente el tamaño efectivo del conjunto de datos. Dado que los modelos de aprendizaje profundo requieren grandes cantidades de datos etiquetados y la anotación es costosa, el aumento es una estrategia estándar para reducir el sobreajuste y mejorar la generalización.
En reconocimiento de imágenes, lograr una precisión competitiva sin aumento es prácticamente imposible.
- Transformaciones geométricas: Volteo horizontal, recorte aleatorio, rotación, escalado y transformaciones afines aumentan la diversidad espacial y enseñan invariancia a la posición y orientación
- Transformaciones fotométricas: Ajustes aleatorios de brillo, contraste, saturación y tono mejoran la robustez ante condiciones de iluminación variables y características de cámara
- Métodos avanzados: Mixup (interpolación lineal de dos imágenes y etiquetas), CutMix (mezcla basada en parches) y RandAugment (búsqueda automatizada de tipos y magnitudes de transformación) proporcionan regularización más allá de las transformaciones simples
Enfoques modernos como AutoAugment y TrivialAugment buscan automáticamente políticas de aumento óptimas. Los modelos generativos se utilizan cada vez más para sintetizar datos de entrenamiento adicionales para clases poco frecuentes. El aumento en tiempo de prueba (TTA), que aplica aumentos en la inferencia y promedia las predicciones, mejora aún más la precisión sin necesidad de reentrenamiento.