摘要
本发明公开了一种基于FPGA的卷积神经网络模块,主要解决现有技术内部结构固化、FPGA型号受限,且处理速度慢的问题,其包括参数存储子模块、总控制子模块、配置寄存器组、网络计算子模块组、缓存子模块和计算控制子模块组。参数存储子模块存储配置参数和网络权值,总控制子模块读取被存储的参数和权值,并写入配置寄存器组和网络计算子模块组,完成内部连接结构和缓存大小的设置及初始化;缓存子模块存储原始输入数据或中间处理结果并传输到计算子模块组,并在计算控制子模块组控制下周期性地完成乘累加、下采样和非线性激活函数的运算。本发明内部结构可配置,支持多种FPGA,功耗较低,处理速度快,可用于构建卷积神经网络加速系统。
- 单位