一种高性能可重构深度卷积神经网络加速器

作者:乔瑞秀; 陈刚; 龚国良; 鲁华祥
来源:西安电子科技大学学报, 2019, 46(03): 130-139.
DOI:10.19665/j.issn1001-2400.2019.03.020

摘要

由于深度卷积神经网络的卷积层通道规模及卷积核尺寸多样,现有加速器面对这些多样性很难实现高效计算。为此,基于生物脑神经元机制提出了一种深度卷积神经网络加速器。该加速器拥有类脑神经元电路的多种分簇方式及链路组织方式,可以应对不同通道规模。设计了3种卷积计算映射,可以应对不同卷积核大小;实现了局部存储区数据的高效复用,可大量减少数据搬移,提高了计算性能。分别以目标分类和目标检测网络进行测试,该加速器的计算性能分别达498.6×109次/秒和571.3×109次/秒;能效分别为582.0×109次/(秒·瓦)和651.7×109次/(秒·瓦)。

全文