摘要
物联网微处理器单元(MCU)的随机存取存储器容量小(64~2 048 kB),是物联网(IoT)发展的最大挑战之一。现有的神经网络压缩算法大多是为了减小深度神经网络(DNN)的模型尺寸,使其能够适应有限的存储空间,并没有显著减少中间特征映射的大小,即使经过压缩,神经网络也有可能不能在微处理器单元中运行。为了在资源受限的物联网微处理器单元上,部署深度神经网络来实现嵌入式设备的智能,提出了一个轻量级的运行时工作内存压缩方法,来动态修剪中间输出特征映射值,使工作内存减少到比RAM还小,以确保能够适应有限的内存。实验结果表明,该方法能够显著降低深度神经网络的工作内存,以满足物联网微处理器RAM大小的约束,同时在内存开销和运行时延相对较低的情况下保持输出推论的准确性。
- 单位