摘要

为解决图像语义分割任务中面对的分割场景的复杂性、分割对象的多样性及分割对象空间位置的差异性问题,提高语义分割模型的精度,提出基于稠密扩张卷积的双分支多层级语义分割网络(double branch and multistage network, DBMSNet).首先采用主干网络提取输入图像的4个不同分辨率的特征图(De1、De2、De3、De4),其次采用特征精炼(feature refine, FR)模块对De1和De3这两个特征图进行特征精炼处理,特征精炼处理之后的输出分支经过混合扩张卷积模块(mixed dilation module, MDM)编码空间位置特征, De4分支采用金字塔池化模块(pyramid pooling module, PPM)编码高级语义特征,最后将两个分支进行融合,输出分割结果.在数据集CelebAMask-HQ和Cityscapes中进行实验,分别得到mIoU精度为74.64%、78.29%.结果表明,本文方法的分割精度高于对比方法,且具有更少的参数量.

全文