基于改进Mask R-CNN的饮料分拣系统实例分割算法

作者:刘重阳; 左云波*; 吴国新; 王慧炳
来源:北京信息科技大学学报(自然科学版), 2023, 38(04): 26-31.
DOI:10.16508/j.cnki.11-5866/n.2023.04.004

摘要

针对饮料瓶摆放过程中的遮挡、光线干扰等因素影响实例分割精度问题,提出了改进掩膜区域卷积神经网络(mask region convolutional neural network, Mask R-CNN)的饮料瓶实例分割算法(drink Mask R-CNN,DRK-Mask R-CNN)。在原Mask R-CNN的网络结构上,使用ResNet101作为网络的特征提取主干网络,通过引入Transformer中的自注意力模块获取全局与局部的联系;通过引入通道注意力模块以及空间注意力模块增加表现力,关注重要特征,并抑制不必要特征;并引入空洞卷积网络模块以扩大感受野,获取多尺度上下文信息,降低计算量。在此基础上完成对自建饮料瓶数据集的数据训练,完成对不同饮料瓶的识别与图像分割。实验结果表明,DRK-Mask R-CNN算法的实例分割平均精度为95.8%,相较于原算法提高4.7百分点。

全文