摘要

语言是人类最重要的信息交流方式,在实际环境中,各种噪声严重影响语音的音质及清晰度,使语音识别的正确率明显下降。若应用语音分离技术将目标语音从混合语音中分离出来,则能有效提高语音识别的性能。语音分离可分为单声道语音分离和多声道语音分离,其中单声道语音分离最为困难。论文研究了基于听觉场景分析(CASA)的单声道语音分离方法,首先以基音周期轨迹为线索,根据浊音的谐波结构,分离出目标语音的频谱,再由傅里叶反变换(IFFT)重构分离语音,针对分离语音中存在的窜音现象,采用振幅平滑和相位调整法消除窜音。实验结果表明,该方法能有效消除窜音现象,显著提高分离语音的清晰度。