摘要
现有的视觉目标跟踪方法只使用第一帧的目标区域作为模板,这导致在快速变化和复杂背景中很容易失效。为了解决这个问题,本文提出了一种基于Transformer的目标跟踪算法,它关注模板中目标焦点信息,并动态更新模板特征。为了减少背景信息对注意力的干扰,本算法使用稀疏Transformer模块来实现特征信息的交互;还提出了模板焦点注意模块,用于对动态模板特征和初始模板特征进行目标焦点的关注,以保留初始模板中高度可靠的特征信息。实验结果表明,本文算法在OTB100基准测试中成功率和准确率分别达到70.9%和91.6%,相较于同类模板更新算法STARK成功率和精确率分别提升4.11%和3.27%。该算法有效地应对了现有视觉对象跟踪方法的局限性,提高了跟踪的准确性和鲁棒性。
-
单位电子信息工程学院; 长春理工大学; 吉林大学第一医院