摘要
全景分割是近年来新提出的图像分割任务。现有全景分割模型大都对前景实例对象和背景未定形区采用不同的方式进行特征表示,因此需要额外的后处理和融合操作来处理各种实例重叠和语义冲突问题。全卷积全景分割网络实现了统一的特征表示,省去了这些复杂操作,但其对于前景实例对象的分割准确率不高,对图像中远距离小目标的分割效果不是很理想。针对这些问题,基于全卷积全景分割网络进行改进优化,提出一种多尺度注意力引导的全景分割网络。首先改进特征提取网络,通过在主干网中添加一条自底向上的辅助路径来增强模型的多尺度特征获取能力。其次提出一种注意力模块,通过将空洞空间金字塔池化与通道注意力融合,引导卷积核更新,生成更匹配的权重。通过在Cityscapes数据集上与全卷积全景分割网络进行对比实验,其图像实例级全景分割质量提高了2.74%,背景未定形区全景分割质量和综合全景分割质量分别提高1.36%和1.94%,对于交通灯和摩托车等小物体的类别检测准确率分别提高了4.4%和8.3%。提出的全景分割网络综合了全卷积全景分割网络、多尺度特征及注意力机制的优点,使得图像实例级全景分割准确率和性能更高。
- 单位