基于门控卷积网络与CTC的端到端语音识别

杨德举; 马良荔; 谭琳珊; 裴晶晶

doi:10.16208/j.issn1000-7024.2020.09.037

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于门控卷积网络与CTC的端到端语音识别

作者：杨德举; 马良荔; 谭琳珊; 裴晶晶

来源：计算机工程与设计, 2020, 41(09): 2650-2654.

DOI：10.16208/j.issn1000-7024.2020.09.037

摘要

针对传统声学模型存在模型组件复杂且不能统一进行训练,数据必须进行预对齐的问题,提出基于一维门控卷积神经网络与CTC的中文端到端语音识别模型。通过堆叠多层一维卷积神经网络进行声学建模,提取包含上下文信息的高层抽象特征,融合门控线性单元减少梯度弥散,利用CTC算法实现以汉字字符作为建模基元的端到端训练和解码。在公开数据集上的实验结果表明,与基线模型相比,该模型语音识别性能有明显提升,字错误率降低了3.3%以上。

单位
中国人民解放军海军工程大学; 电子工程学院

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-13 18:08

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号