摘要

针对铝型材表面纹理复杂、缺陷尺度差异大导致缺陷检测算法精度不高,难以满足实际需求的问题,提出了一种改进的目标检测网络AM-YOLOv3 (attention-guided multi-scale fusion YOLOv3)。设计了注意力引导模块和4个预测尺度,实现了铝型材表面缺陷的多尺度特征提取。构建了自底向上的特征传输路径,与原有的特征金字塔网络结合形成双塔结构,实现了多尺度特征融合。使用K-medians算法进行锚框聚类,更准确地表征了锚框尺寸的分布规律,提高了网络的收敛速度。在公开的铝型材数据集上对所提算法的性能进行了实验验证。实验结果表明,所提算法的mAP(mean average precision)达到了99.05%,比YOLOv3模型提高了6.8%,帧频达到了43.94 frame/s。