摘要
为了将注意力机制引入YOLO模型,从而提高算法的特征融合能力和检测准确率,提出一种基于窗口内部双重注意力机制改进的YOLOv5模型(YOLO-DAW).在neck层中,模型在特征金字塔网络和路径聚合网络中进行特征融合时,分别引入通道注意力和空间注意力机制,并将注意力机制的计算限制在不同大小的窗口内,以降低模型的计算复杂度.不同性质的注意力机制能够为前向特征提供更大感受野的全局特征信息,极大加强了模型对不同特征的理解能力.实验结果表明:模型在公开数据集PASCAL VOC2012以及SODA10M上的mAP50分别达到了68.6%和51.9%;对比同参数量的YOLOv5m, YOLO-DAW在PASCAL VOC2012和SODA10M上均有1.2%的领先.改进后的模型能够更好地融合局部特征与全局特征,使其满足更复杂场景下的检测要求.
- 单位