摘要
特征金字塔网络(FPN)已经成为目标检测中提取多尺度特征的有效框架。然而,FPN存在着由于通道减少导致语义信息丢失、高层特征只包含单尺度的上下文信息和具有语义差别的不同层特征直接融合造成混叠效应等问题。针对上述问题,提出了基于注意力增强指导的特征金字塔网络。该模型由通道特征增强模块、上下文增强模块和注意力指导特征融合模块3个部分组成。具体来说,通道特征增强模块通过建模特征之间的依赖关系减轻由于通道减少造成的信息损失,上下文增强模块利用不同级别特征进行上下文信息提取以增强高层特征,注意力指导特征融合模块利用注意力机制指导相邻层特征学习来增进彼此语义信息的一致性。将Faster R-CNN和Mask R-CNN目标检测器中的FPN替换为本文模型并在不同的数据集上进行实验,实验结果表明,改进后的Faster R-CNN检测器在PASCAL VOC和MS COCO数据集上的平均精度分别提高1.5%和1%,改进后的Mask R-CNN检测器在MS COCO数据集上也分别将Mask AP和Box AP的性能提升了0.8%和1.1%。
- 单位