摘要
针对目前Deeplab v3+模型进行图像语义分割时部分细节损失严重,存在漏分割、误分割现象,在其算法基础上构建了新的语义分割模型N-Deeplab v3+。新模型设计异感受野拼接的空洞空间金字塔池化结构,增强各层级信息间相关性;增设多次跨层特征融合,提升对图像细节的表征力;构建基于注意力机制的特征对齐模块,引导高低级特征对齐并有针对性地强化对重要通道特征的学习,提升模型学习能力。在Cityscapes数据集上的实验结果表明,所提改进方案能够有效提高小尺度目标关注度,缓解目标误分割问题,提升模型语义分割精度。在PASCAL VOC 2012数据集上进一步验证新模型的泛化能力。N-Deeplab v3+模型在Cityscapes数据集和PASCAL VOC 2012数据集上的平均交并比达76.31%和81.97%,较原模型分别提升了1.69个百分点和2.14个百分点。
- 单位