摘要
本发明公开了一种基于卷积核拆分的卷积神经网络硬件加速器系统及计算方法,包括零填充模块、控制模块、卷积核和数据拆分模块、卷积核权重缓存模块、数据缓存模块、片内地址索引模块、核心计算模块和中间结果缓存模块;零填充模块用于卷积核权重和图片数据的零填充处理;控制模块用于控制相关模块运行;卷积核和数据拆分模块用于产生拆分控制信号;卷积核权重缓存模块和数据缓存模块用于存储零填充后的卷积核权重和图片数据;片内地址索引模块用于产生地址索引;核心计算模块用于计算数据;中间结果缓存模块用于存储中间计算结果。本发明能提高运算并行度、降低硬件复杂度,从而适用于大型卷积计算。
- 单位