摘要
本发明属于语音信号处理技术领域,公开了一种基于公共空间语音模型预测的语音增强方法。所述基于公共空间语音模型预测的语音增强方法包括:通过声源字典间相互进行非负矩阵分解(NMF,Non-negative Matrix Factorization),判定出字典内容间是否可以互相表达,形成公共空间;将相互表达的成分,从两字典中分离出来,使用一个公共空间字典额外保存,并通过机器学习工具对公共空间部分的成分进行预测。本发明在没有明显提升算法复杂度的前提下,以修改字典为手段,解决了两个声源字典之间公共空间内数据点无法准确处理的问题,提高了输出语音的质量。
- 单位