摘要
本发明公开了一种基于FPGA的通用型轻量级卷积神经网络加速方法,涉及计算机硬件加速技术领域。获取目标卷积神经网络当前的目标输入数据和模型结构参数;根据目标输入数据和模型结构参数配置目标IP核中的目标功能算子;通过目标功能算子计算目标输入数据得到目标输出数据,并根据模型结构参数和存储单元的容量对目标输出数据进行搬运;根据模型结构参数依次重复执行上述步骤,完成目标卷积神经网络整体的计算。通过将卷积神经网络模型划分成基本算子的组合,根据目标输入数据和目标基本算子的类型配置各个基本算子,依次完成各个目标功能算子的计算,进而完成目标卷积神经网络整体的计算。提升了卷积神经网络加速器的可拓展性和灵活性。
- 单位