摘要
近年来,特征融合在视觉跟踪系统的准确性和鲁棒性方面发挥着重要作用。传统的特征融合方法通常通过直接求和或引入注意力机制进行融合。且在分类网络中,只使用一层特征进行分类,忽视了为鲁棒模型的不同级别的特征分配适当的权重的重要性。针对这一问题,提出了一种基于深度学习的注意力融合目标跟踪算法。首先,提出了一种基于ResNet改进的网络结构,引入一个注意力机制,形成一个迭代的注意力模块,将其原来的直接相加的融合方式替换为注意力特征融合方式。改进的网络结构更有利于不同层次特征的融合。其次,将从骨干网络中提取的第三层和第四层特征送入分类器,将得到的响应图进行融合,获得粗略位置。与此同时,将所提取的特征送入到注意力机制网络中,以分配不同的权重,然后馈送到估计网络中,以执行精确回归框估计。通过实验比较可知,该算法的精确度和成功率均有所提升,并且该算法对不同场景中的目标存在的各种干扰均具有更强的鲁棒性。实验表明了该跟踪器的有效性和高效性。
- 单位