一种嵌入式轻量化卷积神经网络计算加速方法

作者:谢媛媛; 刘一睿; 陈迟晓; 康晓洋; 张立华
来源:小型微型计算机系统, 2023, 44(07): 1345-1351.
DOI:10.20009/j.cnki.21-1106/TP.2021-0744

摘要

针对传统ARM处理器算力低、不适用于实时性需求比较高的应用场景的问题,本文提出了一种基于ARM处理器的单指令多数据(Single Instruction Multiple Data, SIMD)指令集的轻量化卷积神经网络计算加速方法,并将该方法用于处理脑电信号(Electroencephalogram, EEG)来进行手术过程中麻醉深度监测.通过可学习步长量化的方法得到轻量化卷积神经网络,减少浮点数的运算量,极大地提高了网络速度.采用基于ARM处理器SIMD指令集的卷积加速器,各卷积层分别可加速几十倍、几百倍,甚至一万多倍.在Ultra 96-V2开发板上用ARM处理器实现整个网络的运算,在昆士兰大学生命体征公开数据集上的测试结果表明,仅需39.64ms就可以处理时间跨度为1s的EEG单通道信号,速度提高到原来的10.5倍,且功耗仅为0.1J,在提升速度的同时基本保持网络预测的准确率,能够很好地预测出麻醉深度.

全文