摘要
语义分割目前主流的全监督学习方式,数据质量和数量决定了网络的训练效果。只有花费大量的标注成本,才能得到质量高且数据量大的训练数据。根据上述情况,出现了基于半监督学习方式的语义分割。半监督学习可以节省数据的标注成本,很好地解决需要大量标注成本的问题,越来越多人开始关注半监督学习的图像语义分割。根据图像语义分割方法目前的发展现状,提出了一种结合DeepLabv2的生成对抗网络(DL-GAN)的半监督语义分割的模型。首先,将DeepLabv2作为生成对抗网络的生成网络,完全卷积的网络作为判别器网络;其次,对生成网络进行改进,首次将CBAM注意力机制和深度可分离卷积结合应用于DeepLabv2,将其作为生成网络,具体一是在DeepLabv2最后的卷积层前添加CBAM注意力机制,二是将DeepLabv2网络中Resnet残差块的标准卷积替换为深度可分离卷积,使整个模型将权重参数更为合理地分配,提高模型的表征能力且计算更为高效,加快训练效率;最后,用空洞卷积替换判别器的标准卷积,提升整个判别器的感受野,提高训练效果,提升语义分割精度。该文的方法在PASCAL VOC 2012数据集上的实验结果相对于Affinitynet网络平均交并比提高6.3个百分点,证明了该文提出方法是有效的。
- 单位