摘要
具有优越性能的卷积神经网络算法已得到广泛应用,但其参数量大、计算复杂、层间独立性高等特点也使其难以高效地部署在较低功耗和较少资源的边缘场景。为此本文结合该种算法的特点提出了一种基于混合架构的卷积神经网络计算加速方法,该方法选用CPU加FPGA的混合架构,首先对网络模型进行了压缩优化;之后在FPGA上通过指令控制数据流的DSP阵列结构实现了卷积计算加速;最后通过YOLO算法测试了该方法的加速性能,在7000万门级FPGA上各类资源消耗低于50%且总功耗为7.36W的情况下,吞吐率达到了120GOPS。
- 单位