基于注意力掩模融合的目标检测算法

作者:董潇潇; 何小海*; 吴晓红; 卿粼波; 滕奇志
来源:液晶与显示, 2019, 34(08): 825-833.
DOI:10.3788/YJYXS20193408.0825

摘要

在计算机视觉任务中,平衡目标检测的精度与速度对于后续的实际应用如目标跟踪和识别起到关键作用。基于此,提出了一种基于注意力掩模融合的目标检测算法。首先,通过VGG网络提取特征,经过初步二分类和回归后得到一系列预选框;然后,将上述预选框输入到特征金字塔结构中,通过构建注意力掩模模块自适应地学习有效特征,同时融合特征金字塔结构与注意力掩模模块得到更具表征性的特征;最后经过多分类和回归得到多尺度的检测结果。在PASCAL VOC 2007和PASCAL VOC 2012数据集上展开了实验,测试集结果显示,在交集并集比(IOU)为0.5的条件下,对于320×320的图片输入,平均精度均值(mAP)分别为81.0%和79.0%,检测速度为60.9fps。本文算法将注意力信息结合到目标检测中,实现了通用目标检测的精度和速度均衡。

全文