摘要
针对当前主流、先进的目标检测算法在弱光场景下对目标检测精度较低的问题,分析弱光图像削弱了传统卷积神经网络依赖的局部相关性归纳偏置,引入对全局特征有着出色建模能力的Swin Transformer Stage以实现全局注意,增强特征信息量。将全局注意以并行方式与局部卷积共同抽取弱光图像特征,并提出了一种特征交互结构(Feature Interaction Structure, FIS),通过精心设计的二次交互方式,能有效解析、利用和结合局部与全局信息。基于FIS堆叠构造交互式并行双流骨干网络FISNet,实现对两类特征的深度融合,并提供对密集预测型任务十分重要的层级特征结构。FISNet在弱光图像数据集ExDark上达到了40.6AP,与EfficientNet等基准模型相比,得到了+0.5~2.9AP的检测精度提升,在弱光目标检测场景中具有良好的应用。
- 单位