摘要
近年来,卷积神经网络(CNN)已经广泛应用于语音信号识别。为满足嵌入式应用领域低延时、低功耗、可移动等方面的需求,基于轻量化的卷积神经网络模型,实现了一种应用于现场可编程逻辑门阵列(FPGA)的语音识别系统。通过Vivado中的高层次综合(HLS)设计卷积、池化等计算模块并将CNN算法映射到FPGA上。利用流水线约束和数据定点化等方式,提升语音识别速度。实验结果表明:系统的计算速度相较于ARM处理器实现了36.12倍的加速效果,功耗仅为2.205W,达到了低延时和低功耗的设计要求。
- 单位