基于YOLOv3的神经网络模型压缩与实现

作者:张亚平; 吴绩伟; 马占刚; 曹喜信*; 郭文海
来源:微纳电子与智能制造, 2020, 2(01): 79-84.
DOI:10.19816/j.cnki.10-1594/tn.2020.01.079

摘要

目标检测是计算机视觉的一个重要分支,随着深度学习的发展,目标检测也取得了不错的研究成果。目前,基于深度学习的目标检测算法一般采用卷积神经网络,具有很强的自主学习能力并且能够处理相对复杂的数据信息,在图像分类与定位上效果显著。YOLO系列算法是现在比较流行的基于深度学习的目标检测算法,其采用一种端到端的思想,通过一个网络模型同时实现目标的分类和定位。YOLOv3在图片特征提取部分采用53层的卷积神经网络,并在网络结构中加入了残差结构,在提高物体识别准确率的同时增加了模型复杂度,使网络开销变大,这对硬件平台的要求很高。为了解决硬件平台内存消耗过高问题,提出一种改进的目标检测网络结构,核心思想是将网络模型进行裁剪,对裁剪后的模型进一步修整并压缩骨干网络形成一种轻量级的神经网络,可以使模型的规模显著减小。实验结果表明,压缩后的网络模型减小为原始模型的13%,降低了对硬件平台的要求。