摘要
利用银行网点内边缘计算设备进行客流分析、安全保护、风险防控等应用日益广泛,其中AI推理芯片的性能和功耗已经成为边缘计算设备选型的一个非常重要的因素。针对递归神经网络由数据依赖性和低数据重用性导致的功耗大、推理性能弱、能效低,难以在低功耗平台上处理等问题,利用FPGA实现了一种电压可扩展的稀疏循环神经网络(RNN)低功率加速器,并在边缘设计算设备上进行了验证。首先,对稀疏RNN进行分析并采用网络压缩的方法设计了处理阵列;其次,由于稀疏RNN的工作负载不平衡,引入电压缩放方法以保持低功耗和高吞吐量。试验表明,该方法可以显著提高系统的RNN推理速度并降低芯片的处理功耗。
-
单位浪潮电子信息产业股份有限公司; 中国建设银行股份有限公司