摘要

目标检测作为计算机视觉的任务之一已经成为研究热点问题。目前,基于深度学习的目标检测算法层出不穷,但大多数情况下学者只关心它们的模型架构,而忽视了其训练过程。目标检测网络在训练过程中会存在明显的不平衡问题,导致模型检测性能降低,不能达到预期的最佳效果。不平衡问题主要包括两个层次,分别是特征图层次和目标函数层次。为了能够充分发挥目标检测模型架构的潜力,实现更好的训练过程,提出利用Balanced Feature Pyramid和Balanced L1Loss两个模块,同时将它们加入到基于ResNet-50-FPN的Faster R-CNN中,目的是解决Faster R-CNN模型在训练过程中存在的特征图层次和目标函数层次的不平衡问题。通过在MSCOCO数据集上验证,实验结果表明平衡后的模型可达到AP是38.5%的结果,比原Faster R-CNN目标检测模型提高了1.1个百分点。