过拟合

模型过度学习训练数据 (包括噪声和特异性) 导致在未见数据上性能下降 (泛化能力差) 的现象。

过拟合发生在模型记忆训练数据的噪声而非学习可泛化特征时，导致对新数据的预测性能下降。典型症状：训练精度超过 99% 而验证精度停滞在 70% 左右。当模型复杂度与可用数据量不成比例时就会出现。

在图像识别中，用数百万参数的 CNN 在几千张图像上训练几乎不可避免地会过拟合。ResNet-50 的 2500 万参数需要 ImageNet 规模的数据 (128 万张图像) 才能在不使用激进正则化的情况下正确泛化。