摘要

针对传统方法在室内场景目标检测中存在检测精度低、检测速度慢等问题,提出一种改进的YOLOv4算法模型。构建室内场景目标检测数据集,使用K-means++聚类算法优化先验框参数,提高先验框与目标的匹配度;调整原始YOLOv4的网络结构,将跨阶段局部网络结构融入模型颈部网络中,消除在特征融合阶段梯度反向传播导致的梯度信息冗余现象,提高对室内目标的检测能力;引入深度可分离卷积模块,取代模型中原有的3×3卷积层,减少模型参数,提升检测速度。实验结果表明,改进后的YOLOv4算法在室内场景目标检测数据集上的平均精度达83.0%,检测速度达72.1 frame/s,较原始YOLOv4算法,分别提高了3.2个百分点和6 frame/s,同时模型规模缩小了36.3%,优于目前其他基于深度学习的室内场景目标检测算法。