摘要
针对将YOLOv3通用目标检测算法应用于行人检测时的检测精度低、定位不准确的问题,提出了一种基于YOLOv3的适用于行人体态特征的目标检测算法。在预处理生成先验框部分,将MSCOCO通用数据集改进为MSCOCO中的person子集来生成仅针对行人体态特征的锚框,并将生成先验框的K-means算法改进为K-means++算法以弥补K-means算法选择中心点的随意性。针对特征提取,改进了卷积神经网络(CNN) Darknet-53的结构以使其能够提取到更多与行人尺度有关的特征信息。损失函数中的目标定位部分改进为更加符合行人体态特征的损失函数。实验使用MSCOCO训练集中的person子集训练模型,分别使用MSCOCO测试集的person子集和自制的行人数据集作为测试集验证模型。结果显示,对比YOLOv3的通用目标检测算法,该文改进算法更易于提取行人特征并提供有效反馈,提高了检测精度。
-
单位南京理工大学; 自动化学院