摘要
目前,小目标检测任务虽取得了长足发展,但仍存在诸多问题。如,小目标场景往往因为目标自身信息量过少导致目标特征提取难,容易丢失小目标原本的特征信息使得检测效果不佳。为了解决此问题,提出了一种基于两阶段计算Transformer(TCT)的小目标检测网络。首先,在主干特征提取网络中加入两阶段计算Transformer用于特征增强,在传统单阶段计算Transformer值基础上,使用多个一维空洞卷积层分支以不同的特征融合方式获得全局自注意力特征权重,提高特征表达能力与信息交互能力。其次,提出高效的残差连接模块,改进现有的CSPLayer层中低效的卷积层与激活层,有利于促进信息流的交互,学习更丰富的上下文细节特征。最后,提出特征融合与精炼方法以融合多尺度特征,提升目标特征表征能力。通过在PASCAL VOC2007+2012数据集、COCO2017数据集和TinyPerson数据集上进行多个定量与定性实验发现,相较于YOLOX算法,所提算法在小目标检测上具有更强的目标特征提取能力和更高的检测精度。