数据增强
通过对训练数据施加旋转、翻转、色彩抖动等变换来人为增加数据多样性的技术,可提升模型泛化能力并减少过拟合。
数据增强通过对现有训练样本施加几何、光度及其他变换,人为扩大有效数据集规模。由于深度学习模型需要大量标注数据且标注成本高昂,增强已成为减少过拟合、提升泛化能力的标准策略。
在图像识别领域,不使用数据增强几乎不可能达到有竞争力的精度。
- 几何变换:水平翻转、随机裁剪、旋转、缩放和仿射变换增加空间多样性,使模型学习对位置和方向的不变性
- 光度变换:随机调整亮度、对比度、饱和度和色相,提高对不同光照条件和相机特性的鲁棒性
- 高级方法:Mixup(两张图像及标签的线性插值)、CutMix(基于区块的混合)和 RandAugment(自动搜索变换类型和强度)提供超越简单变换的正则化效果
AutoAugment 和 TrivialAugment 等现代方法可自动搜索最优增强策略。生成模型也越来越多地用于为稀有类别合成额外训练数据。测试时增强 (TTA) 在推理阶段施加增强并对预测取平均,无需重新训练即可进一步提升精度。