池化
通过聚合局部区域内的值来降低特征图空间维度的下采样操作,在降低计算量的同时增加平移不变性。
池化是 CNN 中的空间下采样操作,通过在固定大小窗口内汇总值来减小特征图维度。通过将局部区域折叠为单个值,池化降低计算量同时引入对小空间偏移的平移不变性。
最常见的配置是步长为 2 的 2x2 最大池化,在每个非重叠区域中选择最大值。这将宽度和高度减半,空间面积缩减为四分之一。VGG-16 应用五次最大池化,将 224x224 输入缩小到 7x7 后接全连接层。
- 最大池化:保留每个区域中最强的激活,保留边缘等显著特征。在分类和检测架构中占主导地位
- 平均池化:计算每个区域的均值。全局平均池化 (GAP) 将每个通道折叠为单个标量,替代全连接层并减少过拟合
- 步长卷积:使用可学习参数进行下采样 (步长 2),相比固定池化操作最小化信息损失
现代架构越来越多地用步长卷积替代池化,但 GAP 作为分类器头部仍是标准。对于分割任务,池化索引存储和空洞卷积等技术保留空间精度。