一种面向忆阻器加速器的神经网络模型压缩框架

作者:沈林耀; 王琴; 蒋剑飞; 景乃锋
来源:微电子学与计算机, 2021, 38(08): 20-27.
DOI:10.19304/j.cnki.issn1000-7180.2021.08.004

摘要

当前基于忆阻器的神经网络加速器存在的资源需求高、系统功耗大等问题,提出了一种包含剪枝及量化算法在内的神经网络模型压缩框架.根据忆阻器阵列紧密耦合的特点,设计了一种忆阻器阵列感知的规则化增量剪枝算法,在保证模型准确度的条件下实现了硬件资源的节省;针对忆阻器加速器系统中ADC单元和忆阻器阵列功耗占比过大等问题,设计了一种二的幂次量化算法以降低加速器系统中ADC的精度需求以及计算阵列中低阻值忆阻器器件个数,实现系统功耗的降低.实验结果表明:提出的神经网络模型压缩框架在忆阻器加速器部署网络时可取得17.2~30.7倍的能效提升以及4.3~9.3倍的加速比,模型的精度损失维持在1%左右.

全文