摘要

卷积神经网络在对图像进行语义分割时,高层特征经过降采样和padding操作和低层特征之间容易产生错位。为了解决高低层特征之间的错位问题,更好地聚合多尺度特征信息,本文提出一种带有多尺度特征对齐聚合(MFAA)模块的语义分割方法。MFAA模块采用一种可学习插值策略来学习像素的变换偏移,可以有效缓解不同尺度特征聚合的特征不对齐问题,同时模块内的注意力机制提高了解码器恢复重要细节特征的能力。该方法利用高层特征的语义信息和低层特征的空间信息,通过多个MFAA模块将高低层特征对齐之后聚合到一起,从而实现图像更加精细的语义分割效果。提出的网络结构在语义分割数据集PASCAL VOC2012上进行验证,使用ResNet-50作为骨干网络在验证集上的mIoU值达到了78.4%。实验结果显示,该方法与几种主流分割方法相比在评价指标方面存在优越性,可以有效提高图像分割的效果。