摘要
针对饮料瓶摆放过程中的遮挡、光线干扰等因素影响实例分割精度问题,提出了改进掩膜区域卷积神经网络(mask region convolutional neural network, Mask R-CNN)的饮料瓶实例分割算法(drink Mask R-CNN,DRK-Mask R-CNN)。在原Mask R-CNN的网络结构上,使用ResNet101作为网络的特征提取主干网络,通过引入Transformer中的自注意力模块获取全局与局部的联系;通过引入通道注意力模块以及空间注意力模块增加表现力,关注重要特征,并抑制不必要特征;并引入空洞卷积网络模块以扩大感受野,获取多尺度上下文信息,降低计算量。在此基础上完成对自建饮料瓶数据集的数据训练,完成对不同饮料瓶的识别与图像分割。实验结果表明,DRK-Mask R-CNN算法的实例分割平均精度为95.8%,相较于原算法提高4.7百分点。
-
单位机电工程学院; 北京信息科技大学