摘要
视觉目标跟踪是计算机视觉领域的一个基本问题。目前,采用深度卷积方法的相关滤波器(DCF)在目标跟踪领域取得了优秀的成果。然而,大多数现有的跟踪器仅考虑当前帧的外观特征,几乎不考虑目标运动和帧间信息,不能很好地解决诸如遮挡、阴影和变形等问题。因此,我们将利用连续帧中丰富的运动信息来提高跟踪性能。首先,我们将光流信息,特征提取和相关滤波表示为深度学习网络中的相关特殊层,从而能够进行端对端深度学习网络的训练。然后,提出了一种全新的时空注意力机制,通过时空注意力机制的加权,将预定间隔的历史特征图相融合并与当前的特征图进行自适应聚合。最后,在公共数据进行了大量实验,得到了满意的结果。
- 单位