面向变电站智能运检的声音谱特征语音识别方法

高宝明; 孙国繁; 冯俊杰; 段雨松; 刘霄; 杨爱民

doi:10.13296/j.1001-1609.hva.2023.11.005

摘要

语音识别是变电站智能运检中关键的人机交互技术。然而，由于生产环境中存在使用专业术语多和噪声大的问题，传统的语音识别方法的效果受限。为此，文中提出了一种基于声音谱特征的语音识别方法。通过融合MFCC与CQT谱，形成一种基于声音谱的特征参数，通过对参数分布的估计，能够有效地降低语音信息中的噪声干扰。为提升语音识别性能，文中设计一个端到端的语音识别模型。该模型基于卷积神经网络（CNN），并融合了CTC和注意力机制。CNN网络能够有效地捕捉语音数据中的局部模式和结构信息，而CTC和注意力机制在解码过程中起到关键作用。文中使用Aurora、Aishell以及运检语音数据集进行了实验评估，比较了语音降噪、语音识别同传统方法的效果。实验结果表明，所提出的语音识别模型取得了显著的性能提升，可为相关领域的研究和应用提供有价值的参考。

单位
国网山西省电力公司

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-18 17:57

面向变电站智能运检的声音谱特征语音识别方法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友