基于FPGA的CNN加速SoC系统设计

赵烁; 范军; 何虎

doi:10.16208/j.issn1000-7024.2020.04.007

摘要

为提高目前硬件运行卷积神经网络(CNN)的速度和能效,针对主流CNN网络的卷积计算设计加速模块并在FPGA上实现用于加速CNN网络的SoC系统。硬件平台采用带有ARM处理器的ZCU102FPGA开发板,系统采用处理器和加速器的结构进行设计。加速器负责卷积计算,采用分块技术并重组卷积计算循环次序,使片上缓存的数据复用率更高,减少系统与内存之间数据的传输。支持1×1到11×11的卷积核尺寸,硬件支持的激活函数为ReLU和Leaky ReLU。处理器负责控制并处理CNN网络的其它计算,使SoC系统具有通用性和灵活性。实验结果表明,在100 MHz的工作频率下,峰值计算性能可以达到42.13GFLOPS,相比CPU和其它FPGA计算的性能有一定提升。

单位
清华大学

全文

访问全文

收藏分享被引(24) 浏览

更新时间：2024-04-13 17:19

基于FPGA的CNN加速SoC系统设计

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友