基于ZCU102 DSP的CNN卷积运算加速方法

作者:苗鑫; 周欢欢; 陆栋洵
来源:自动化技术与应用, 2022, 41(12): 64-67.
DOI:10.20033/j.1003-7241.(2022)12-0064-04

摘要

本文提出设计了一种在ZCU102平台上加速卷积神经网络(CNN)卷积运算的方法,使用1个DSP IP实现卷积操作中1个int8类型或者unit8类型输入特征图像数据和2个int8类型卷积核参数的乘法运算。卷积运算是卷积神经网络的基本操作,提高卷积运算并行度可使卷积运算速率提升一倍。8-bit卷积神经网络量化技术是设计实现的基础,减少了处理器(PS)数据传输带宽需求。ZCU102 MPSoC的可编程逻辑(PL)资源较少,充分利用DSP IP资源可降低逻辑资源需求,提升逻辑资源利用率,增加SoC系统设计灵活性。