基于DeepLabv3的样本不均衡图像语义分割研究

作者:王汉谱; 刘志豪; 谷旭轩; 廖建英; 贺志强; 涂兵; 彭怡书*
来源:成都工业学院学报, 2022, 25(03): 16-21.
DOI:10.13542/j.cnki.51-1747/tn.2022.03.004

摘要

卷积神经网络(Convolutional Neural Networks,CNN)在处理语义分割上具有独特优势,但是小目标、稀少目标等样本不均衡问题成为影响分割精度的重要因素。由此提出一种以Deep Labv3网络为基本框架,结合了Focal Loss和GPB/OWT/UCM边缘分割的图像语义分割方法。首先,利用Deep Labv3网络中Resnet101编码器进行特征提取,所得特征经过空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块后获得多尺度信息,再通过解码器恢复到原图分辨率,进行图像的像素级分割;然后,引入Focal Loss替换原来网络中的交叉熵损失函数,即在原来每个单像素损失值上加权重,加强对困难样本特征的学习;最后,融合GPB/OWT/UCM边缘分割算法,使得小目标区域的语义信息仅由低等级特征去单独决定,从而优化小目标和稀少目标的边缘细节的分割。实验结果表明:在PASCAL VOC 2012数据集上,该方法所得均交并比(Mean Intersection over Union,MIoU)为80.23%,相比于原来Deep Labv3网络,MIoU值提升了0.71%,改善了样本不均衡问题。

全文