摘要
深度目标检测模型的性能优势主要受益于主干网络的特征表达能力,其中的下采样操作是执行语义集成的关键步骤。然而,现有下采样方法采用的小感受野机制,通常会导致采样特征存在全局性结构信息不足的局面。对此,本文提出了一种即插即用的双支路下采样方法DPDM(Dual Path Down-sampling Method, DPDM)。该方法采用附加大感受野采样支路的方式来改善主干网络对后期检测的支撑效果。具体来说,在保留传统小感受野下采样操作的前提下,DPDM构建了一个兼顾效率的大感受野采样支路,来添加采样特征的结构性信息。该支路借鉴空间转深度操作,实现了常规小卷积核设置下的大感受野采样功能。双支路采样操作增加了采样多样性,但并未考虑两者之间的协同。因此,该方法随后采用通道拼接和逐点卷积技术,将两者进行了融合。以当前性能占据优势的YOLO系列模型为基准,在三个不同模型(YOLOX,YOLOv5,YOLOv6)及多个数据集上的实验对比,验证了该方法在改善模型检测精度上的效用。
- 单位