摘要

针对Faster RCNN算法对于小尺寸目标以及遮挡或截断物体检测能力不理想的问题,提出一种融合CBAM注意力机制和FPN特征金字塔结构的改进Faster RCNN(Faster RCNN Integrating CBAM and FPN, CF-RCNN)算法。首先,为了重点聚焦特征图像局部高效用信息,减少无效目标的干扰,提升面对遮挡或截断物体的检测能力,在特征提取网络中融入CBAM机制;其次,为了增强小目标物体的检测效果,引入了FPN特征金字塔结构,联结高层与底层特征数据,获得高分辨率、强语义数据;再次,为了缓解梯度消失现象,减少超参数规模,使激活函数信息在高维环境中得到更好保留,提高检测准确率,使用表达能力较强的倒残差ResNet-50(ResNet-50 with Inverse Residual Structure, VS-ResNet)网络替换常用的VGG16网络,VS-ResNet网络在原有ResNet-50基础上修改了部分层次结构,加入辅助分类器,改用倒残差和组卷积方式;最后,为了弥补非极大值抑制(Non-Maximum Suppression, NMS)算法误消除重叠检测框的缺陷,重置候选框分值计算方法。实验表明,VS-ResNet基于CIFAR-10数据集,比VGG16正确率提高了2.97个百分点,CF-RCNN在PASCAL VOC2012数据集上的目标检测mAP值为76.2%,比原始的Faster RCNN算法的mAP值62.3%提高了13.9个百分点。

  • 单位
    南京工业大学浦江学院

全文