摘要

一般的同步叠加算法在进行语音时长规整时,当压扩程度较大且语音采样率较低时,所得合成信号的语音质量会显著下降。其原因在于忽略了语音本身各部分对感知的贡献,对感知敏感成分过度压扩会损害语音的感知质量。本文提出一种先识别语音中的瞬态成分、稳态成分和安静成分,再对各部分采用不同压扩比进行同步叠加的时长规整算法。对语音信号的感知敏感成分压扩较小,希望能够提高合成语音质量。实验证明本方法对低采样率合成语音质量有显著改善,在低码率语音编码中可以有效提高编码效率。