摘要
在伪装目标检测中,针对以往的特征融合研究大多采用多级特征集成,而忽略了不同特征间的差异。文中提出一种基于全局上下文交互融合网络用于伪装目标检测。利用改进的金字塔视觉转换器(PVTv2)模型作为骨干网络,在多个尺度上提取全局上下文信息。首先,设计边界增强模块来关注伪装目标的结构细节,并获取物体的边缘特征。其次,借鉴动物捕食机制提出了特征融合解码模块,该模块提供位置信息用于潜在目标定位以产生粗略定位图。最后,通过所搭建的全局上下文聚合模块进行多层次信息的充分交互,减少特征聚合过程中的信息丢失。采用4个公开数据集、4种评价指标进行实验,实验结果表明文中网络性能优于其它17个具有代表性的模型。
- 单位