面向深度学习目标检测模型训练不平衡研究

贺宇哲; 何宁<sup>*</sup>; 张人; 梁煜博; 刘晓晓

摘要

目标检测作为计算机视觉的任务之一已经成为研究热点问题。目前，基于深度学习的目标检测算法层出不穷，但大多数情况下学者只关心它们的模型架构，而忽视了其训练过程。目标检测网络在训练过程中会存在明显的不平衡问题，导致模型检测性能降低，不能达到预期的最佳效果。不平衡问题主要包括两个层次，分别是特征图层次和目标函数层次。为了能够充分发挥目标检测模型架构的潜力，实现更好的训练过程，提出利用Balanced Feature Pyramid和Balanced L1Loss两个模块，同时将它们加入到基于ResNet-50-FPN的Faster R-CNN中，目的是解决Faster R-CNN模型在训练过程中存在的特征图层次和目标函数层次的不平衡问题。通过在MSCOCO数据集上验证，实验结果表明平衡后的模型可达到AP是38.5%的结果，比原Faster R-CNN目标检测模型提高了1.1个百分点。

单位
北京联合大学

收藏分享被引(7) 浏览

更新时间：2024-03-19 12:26

面向深度学习目标检测模型训练不平衡研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友