摘要

存算一体加速器因其高能效和低功耗的特点受到广泛关注,但在神经网络模型与存算一体加速平台之间缺乏高效的自动化映射工具。为了改善这一局面,本文提供一个面向忆阻器存算一体加速平台的自动代码生成软件栈,以将训练后的神经网络模型映射在存算一体加速器上。为了提高映射的效率,本文借助Halide调度卷积算子的循环空间,并设计优化连续内存访问、优化忆阻器阵列权重更新次数等优化策略。相比与默认映射方案,本文在典型卷积层中权重更新次数减少85%~96%。