摘要

中远距离水声语音通信时,由于水声信道可利用带宽窄的原因,通信速率较之无线电信道低。在高质量通话的前提下,语音编码码率也在一定范围内受到制约。在众多低速率语音编码标准中,美国联邦标准 MELP(Mixed Excitation Linear Prediction)是最佳选择,其编码码率 2.4kbit/s 对于水声信道来说仍然偏高。考虑到水声信道的特点,结合语音信息不均匀分布、MELP 编码参数分析和简化、码本冗余度降低等几个方面,从语音生成和听觉感知角度深入研究了 MELP 编码标准,采用不定帧数联合编码的方式,提出一种码率可调节的高保真语音编码算法。正常语速下,平均码率约 800bit/s。合成语音清晰可懂,保持了说话人的个性特征,其 PESQ MOS (perceptualevaluation of speech quality mean opinion score)评分不低于 2.7,语音质量接近 2.4kbit/s MELP 标准水平,满足了中远距离(>10km)水声高质量语音通信的要求。同时,本算法也可用于其他对实时性要求不高的场合。

  • 单位
    中国科学院