CNN(卷积神经网络)
一种使用卷积层和池化层从图像中分层提取空间特征的深度学习架构,已成为图像识别的标准模型。
CNN(Convolutional Neural Network,卷积神经网络)能高效学习图像中的空间模式。与将空间结构展平的全连接网络不同,CNN 通过卷积保留邻域关系,实现从边缘到语义概念的分层特征提取。
核心组件:
- 卷积层:滤波器在输入上滑动检测局部特征。浅层捕获边缘;深层识别物体
- 池化层:降低空间分辨率,减少计算量同时增强平移鲁棒性
- 批量归一化:归一化输入分布,稳定训练过程
- 全连接层:将特征向量转换为类别概率
里程碑架构:
LeNet-5(1998):开创了 CNN 用于数字识别AlexNet(2012):赢得 ImageNet 竞赛,点燃深度学习革命VGGNet(2014):用 3×3 滤波器证明了深度的重要性ResNet(2015):跳跃连接使 100 层以上的网络训练成为可能EfficientNet(2019):统一缩放宽度、深度和分辨率
除分类外,CNN 还作为目标检测(YOLO、SSD)、语义分割(U-Net、DeepLab)和姿态估计的骨干网络。Vision Transformer 在大规模任务上与之竞争,但 CNN 在边缘设备上仍占主导地位。