基于瓶颈复合特征的声学模型建立方法

郑文秀; 赵峻毅; 文心怡; 姚引娣

doi:10.19678/j.issn.1000-3428.0056278

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于瓶颈复合特征的声学模型建立方法

作者：郑文秀; 赵峻毅; 文心怡; 姚引娣

来源：计算机工程, 2020, 46(11): 301-314.

DOI：10.19678/j.issn.1000-3428.0056278

摘要

针对梅尔频率倒谱系数(MFCC)语音特征不能有效反映连续帧之间有效信息的问题,基于深度神经网络相关性和紧凑性特征,提出一种融合神经网瓶颈特征与MFCC特征的复合特征构造方法,提高语音的表征能力和建模能力。从语音数据中提取MFCC特征作为输入数据,将MFCC特征和BN特征进行串接得到新的复合特征,并进行GMM-HMM声学建模。在TIMIT数据库上的实验结果表明,与单一的瓶颈特征和深度神经网络后验特征相比,该方法识别率明显提升。

单位
通信与信息工程学院; 西安邮电大学

全文

访问全文

收藏分享被引(7) 浏览

更新时间：2024-04-13 03:11

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号