摘要
当前的研究中密集场景行人检测精度较低,为提高检测精度,提出一种基于YOLOv5网络的改进方法V-YOLO,采用加权双向特征金字塔网络(bi-directional feature pyramid network, BiFPN)改进原始网络中的路径聚合网络(path aggregation network, PANet),加强多尺度特征的融合能力,提高对行人目标的检测能力。为了保留更多的特征信息,提高主干网络的特征提取能力,添加残差结构VBlock;引入SKNet(select kernel networks)注意力机制,动态融合不同感受野的特征图,提高对不同行人特征的利用率。使用CrowdHuman数据集进行训练和测试,实验结果表明,所提出算法比原始网络的精确度、召回率和平均精度值分别提高1.8%、2.3%和2.6%,验证了所提出算法能有效的提高密集场景下行人目标检测的准确率。
-
单位天津理工大学; 自动化学院