面向变电站智能运检的声音谱特征语音识别方法

作者:高宝明; 孙国繁; 冯俊杰; 段雨松; 刘霄; 杨爱民
来源:高压电器, 2023, 59(11): 40-47.
DOI:10.13296/j.1001-1609.hva.2023.11.005

摘要

语音识别是变电站智能运检中关键的人机交互技术。然而,由于生产环境中存在使用专业术语多和噪声大的问题,传统的语音识别方法的效果受限。为此,文中提出了一种基于声音谱特征的语音识别方法。通过融合MFCC与CQT谱,形成一种基于声音谱的特征参数,通过对参数分布的估计,能够有效地降低语音信息中的噪声干扰。为提升语音识别性能,文中设计一个端到端的语音识别模型。该模型基于卷积神经网络(CNN),并融合了CTC和注意力机制。CNN网络能够有效地捕捉语音数据中的局部模式和结构信息,而CTC和注意力机制在解码过程中起到关键作用。文中使用Aurora、Aishell以及运检语音数据集进行了实验评估,比较了语音降噪、语音识别同传统方法的效果。实验结果表明,所提出的语音识别模型取得了显著的性能提升,可为相关领域的研究和应用提供有价值的参考。

  • 单位
    国网山西省电力公司

全文