摘要
多目标跟踪是计算机视觉领域的一个重要研究内容。JDE(Joint Detection and Embedding)多目标跟踪算法推理速度和精度较高,但是当目标重叠或尺度较小时,该算法的跟踪效果较差。针对以上问题,本文提出了Attention-JDE,该模型结合了注意力机制、多尺度融合等思想,利用特征金字塔(Feature Pyramid)和空间金字塔池化(Spatial Pyramid Pooling)提升模型对于小尺度目标的检测和跟踪能力,结合空间域注意力机制和通道域注意力机制改进模型在目标发生重叠时的跟踪效果。此外,本文还引入了Mish激活函数有效地降低跟踪时的ID切换次数。在MOT16数据集进行验证,结果表明,与原JDE方法以及其他主流方法相比,Attention-JDE具有更高的跟踪精度(MOTA),同时速度能够达到19.5FPS,实时性较高。
- 单位