摘要

语义分割是计算机视觉处理的关键步骤之一。对于复杂多分类的图像分割问题,本文在U-Net结构的基础上,提出了一种更深层次的神经网络。为提高U-Net对多类别图像的分割能力,在编码部分每个层级增加卷积操作,同时引入残差学习,缓解深层网络的退化现象;在解码部分采用密集连接,增强网络对浅层特征的传递与利用,牺牲部分时间性能用以提高网络的分割能力,同时使用反卷积代替线性插值来解决由不可学习参数引起的细节信息丢失,使重建后的分割结果更加精细。在公开的PASCAL VOC数据集上评估模型性能,获得了MIoU为75.66%, MPA为84.24%, Precision为87.87%的结果,与U-Net相比,所提算法的MIoU提高了4.81%, MPA提高了11.32%, Precision提高了5.17%。实验结果表明,RDeUDNet提升了对多分类图像进行语义分割的性能。