摘要
针对半导体生产过程中的晶粒缺陷检测任务,提出了一种融入多头注意力机制的新型CNN模型(AttnNet).该模型使用深度可分离卷积和标准卷积累加的卷积结构提取输入图像特征,借助多头注意力机制更新特征权重,输出注意力机制筛选的图像分类结果.在13 513张晶粒图像构成的数据集上训练、验证及测试,并与VGG-16、ResNet-50和MobileNet-v2进行对比.相较于现有经典CNN网络模型,Attn-Net检测用时更短(1.26 s),模型尺寸更小(25 MB),在测试集上的分类准确率超过99%,是一种高效且轻量化的晶粒缺陷检测和分类模型.
-
单位天津科技大学; 自动化学院