摘要
本发明公开一种基于FPGA的一维CNN-LSTM加速平台及方法,该平台包括通用CPU和FPGA两部分,通用CPU解析一维CNN-LSTM神经网络模型并生成指令序列加载到FPGA端的指令存储器,量化模型参数加载到FPGA端的结果存储器,FPGA端的控制器读取指令存储器中的运算指令并控制运算器完成相应的运算,所有运算指令完成后将最终的运算结果写入FPGA端的结果存储器供CPU读取。本发明通过复用同一个乘加阵列完成一维卷积和矩阵乘法两种运算的并行加速,解决了现有技术的单一加速方案中无法支持CNN-LSTM神经网络模型计算的问题,大大提高了FPGA的计算资源利用率。
- 单位