摘要

考虑到目标检测任务中由于目标尺寸大小、形态、遮挡和照明条件的巨大差异,论文对Faster R-CNN算法进行改进。首先,选择残差网络ResNet-101作为特征提取网络;其次,受Mask R-CNN中RoI Align的启发,引入RoI Align单元并结合双线性插值的方法保留浮点数以提高检测精度;最后采用soft-NMS算法代替传统的NMS算法来进行非极大值抑制,使得重叠度高的物体能被成功检测。实验结果表明在PASCALVOC2007数据集中改进算法均值平均精度为80.2%,相比faster R-CNN算法提高了3.8%。