摘要
本发明提供了一种基于NAND闪存的低功耗神经网络加速器存储架构,其特征在于:包括片外NAND闪存存储单元、神经网络计算电路、内部全局缓存和控制器;内部全局缓存包括权重缓存、输入缓存、中间结果缓存和输出缓存;当进行神经网络计算时,控制器读取片外NAND闪存存储单元的权重数据,并将载入到权重缓存中;将输入数据载入到输入缓存中;神经网络计算电路载入权重缓存存储的权重数据与输入缓存存储的输入数据,之后进行运算,神经网络计算电路的中间计算结果缓存到中间结果缓存中,最后运算结果缓存到输出缓存中,再将最后运算结果进行输出。该架构可满足深度学习算法在端侧设备完成推理任务的计算需求,功耗低,具有断电保护作用。
- 单位