图像分割
将图像划分为有意义的区域 (物体、背景、部件) 并为每个像素分配标签的过程,是图像分析的核心技术。
图像分割为图像中的每个像素分配语义标签,将其划分为有意义的区域。与使用边界框的目标检测不同,分割提供像素级精确的边界,实现详细的场景理解。
分割类别:
- 语义分割:为每个像素分配类别标签 (人、车、道路),不区分个体实例
- 实例分割:分别识别各个物体,区分人 A 和人 B
- 全景分割:统一两者,同时处理背景类别和前景实例
经典方法与深度学习方法:
- 经典方法:阈值化、区域生长、分水岭、图割。高效但对复杂场景能力有限
- 深度学习:FCN、U-Net、DeepLab、Mask R-CNN。在各种领域达到最先进的精度
应用包括自动驾驶 (道路和行人划定)、医学影像 (器官和肿瘤提取)、遥感 (土地利用分类) 和视频编辑 (背景去除)。标准评估指标为 IoU (交并比) 和 Dice 系数。