基于BLSTM-CTC的语音特征的音素识别研究

吴丹丹; 夏秀渝

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于BLSTM-CTC的语音特征的音素识别研究

作者：吴丹丹; 夏秀渝

来源：现代计算机(专业版), 2022, 28(10): 32-38.

摘要

音音素是自然语言中的最小建模单元，音素识别模型的优劣直接影响关键词检索、连续语音识别的性能。本文首先针对幅度特征MSRCC和相位特征PSRCC进行了一系列对比实验研究，发现融合幅度特征和相位特征可以取得更好的识别效果；接着比较分析了几种深度神经网络的优缺点，并将它们用于音素识别，仿真实验表明基于BLSTM-CTC的声学模型相比于其他模型具有更好的识别性能。

单位
四川大学

收藏分享被引浏览

更新时间：2024-03-19 22:09

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号