面向ZYNQ SoC的卷积神经网络加速器研究

作者:武世雄; 高巍; 尹震宇*; 张飞青; 徐福龙
来源:小型微型计算机系统, 2022, 43(12): 2682-2688.
DOI:10.20009/j.cnki.21-1106/TP.2021-0483

摘要

近年来,卷积神经网络逐步应用于工业生产、自动驾驶和航天航空等领域.随着卷积神经网络结构复杂度的不断提高,将其部署到现场可编程门阵列(Field Programmable Gate Array, FPGA)时存在参数量较大、访存次数较多等问题,导致硬件资源消耗较大.因此,提出了一种基于参数量化的卷积神经网络加速器.该加速器对参数进行了8位定点量化和重新排序,有效的减少了内存占用和访存次数,提高了带宽的利用率;同时,该研究采用滑动窗口间并行策略进行加速,提高了图像分类速度.实验结果表明,在Xilinx ZYNQ XC7Z100上实现此加速器,处理一张图片所需要的时间为15.10ms,平均性能为80.88GOPS,性能密度为0.47.与其他卷积神经网络加速器相比,性能密度提升了1.14~1.76倍.