摘要
本发明涉及卷积神经网络压缩技术领域,且公开了一种基于预量化和缩放系数剪枝的卷积神经网络压缩方法,包括以下步骤:首先通过提出的约束损失函数对预训练的卷积神经网络模型进行预量化,训练结束后网络中的权值会被约束为量化值的近似值,称为预量化值,同时在训练过程中使用稀疏正则化损失函数对批标准化层的通道缩放系数进行稀疏化处理;本发明将剪枝和量化两种模型压缩方法有机结合而非简单叠加,考虑了量化对剪枝的影响,在训练中生成适应于量化值的剪枝结构,相对于直接结合传统剪枝和量化方法,本技术方案可以充分发挥剪枝和量化的优势,使用更少的参数量达到相当或更优异的精度表现。
- 单位