数据增强

通过对训练数据施加旋转、翻转、色彩抖动等变换来人为增加数据多样性的技术，可提升模型泛化能力并减少过拟合。

数据增强通过对现有训练样本施加几何、光度及其他变换，人为扩大有效数据集规模。由于深度学习模型需要大量标注数据且标注成本高昂，增强已成为减少过拟合、提升泛化能力的标准策略。

在图像识别领域，不使用数据增强几乎不可能达到有竞争力的精度。

几何变换：水平翻转、随机裁剪、旋转、缩放和仿射变换增加空间多样性，使模型学习对位置和方向的不变性
光度变换：随机调整亮度、对比度、饱和度和色相，提高对不同光照条件和相机特性的鲁棒性
高级方法：Mixup（两张图像及标签的线性插值）、CutMix（基于区块的混合）和 RandAugment（自动搜索变换类型和强度）提供超越简单变换的正则化效果

AutoAugment 和 TrivialAugment 等现代方法可自动搜索最优增强策略。生成模型也越来越多地用于为稀有类别合成额外训练数据。测试时增强 (TTA) 在推理阶段施加增强并对预测取平均，无需重新训练即可进一步提升精度。

相关术语