摘要
为提高行为识别算法的实时性,适用于资源有限的嵌入式设备,提出了一种行为识别算法硬件加速方法,并在FPGA平台实现。传统的基于可穿戴传感器的行为识别算法需要严格标记的数据进行训练分类,但传感器序列的标注过程消耗大量的人力和计算资源,针对该问题,在传统的卷积神经网络模型中引入注意力机制,用于基于弱标签数据的行为识别。算法中的卷积、池化和注意力机制等计算模块使用高层次综合设计。针对模型的运算特性,通过流水线约束、多像素多通道并行计算和数据定点化等方法,提升运算速度。在Ultra96_V2平台上使用弱标签数据集进行实验,实验结果表明,所设计的行为识别系统识别准确率达到了90%的同时,计算速度达到25.89 frams/s,相较于ARM_A53处理器实现了54.15倍的加速效果。系统的平均功耗为2.204 W,功耗效率为11.75 frames/J,满足了低功耗、低延时设计要求。
- 单位