摘要
伴有复杂参数空间的目标检测神经网络模型很难直接部署在计算资源受限的设备上,模型量化的方法能有效对模型进行压缩,但是量化降低模型大小的同时会带有频繁的量化计算开销以及模型精度的下降。针对这一问题,本文先提出一种将浮点数模型量化为定点数模型的优化量化算法,并以一阶段和二阶段经典检测网络FasterRCNN和YOLOv3作为原始模型,在PASCAL VOC2012数据集进行模型训练得到baseline模型,然后对baseline模型做clip与量化。实验结果表明,量化后的模型与浮点数模型相比检测精度下降了0.5%~2%,模型大小压缩了近75%。
- 单位