在波形网络中融合相位信息的骨导语音增强

郑昌艳; 杨吉斌; 张雄伟<sup>*</sup>; 孙蒙

doi:10.15949/j.cnki.0371-0025.2021.02.016

摘要

已有骨导语音增强算法重点关注语音幅度谱增强,在波形合成时会因为相位不匹配导致语音质量下降。为解决该问题,提出了一种融合相位信息的波形网络(WaveNet)模型实现骨导语音增强波形生成。该方法以频带扩展WaveNet为基础,融合骨导语音相位谱信息与增强的语音幅度谱作为模型的条件特征,根据融合特征生成增强语音波形,实现了相位信息的有效利用。仿真实验综合对比了群时延谱和瞬时频率偏差谱相位特征,主客观结果表明,不论是采用串联融合还是卷积融合方式,骨导语音相位信息均有效补充了原有幅度谱条件特征,改善了语音增强效果。利用串联方式融合群时延谱特征可得到最佳结果,相比于原始骨导语音,平均意见得分(MOS)提升了约54.3%。

单位
中国人民解放军陆军工程大学

全文

访问全文

收藏分享被引(5) 浏览

更新时间：2024-04-17 15:27

在波形网络中融合相位信息的骨导语音增强

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友