摘要
在工业生产制造过程中,由于生产失误致使产品表面缺陷不仅影响产品质量,同时也会损害企业形象.针对现有方法使用卷积神经网络只具备局部感受野的问题,将Vision Transformer(ViT)作为特征提取器,ViT可以通过位置编码与图像块间的互相运算充分利用图像中各部分间的关联特征.此外,针对现实场景下的缺陷区域是不规则、不连续的,现有的模型也未充分利用图像中通道与空间信息问题,提出了一种基于可变形卷积融合空间通道双注意力机制的方法(deformable convolutional and dual attention flow,简称DCA-Flow).对于不规则的缺陷区域,使用形变建模能力更强的可变形卷积进行特征提取,并利用通道与空间维度的注意力机制对可变形卷积提取的特征进行权重再调节.实验结果表明,所提出的方法能够有效检测各种类别物体中的表面缺陷,在多种物体中的平均AUROC值可达96.4%,相较基线方法最大值提高了1.4%,且具备更好的泛化性.
- 单位