摘要

由于音域信号的语音和音乐常常以混叠的形式出现,因此在许多应用中,希望有效分离出音域信号中的语音和音乐.普通的分离方法一般采用基于频域信号的处理方式.而频域信号还原时需借助相位信息,导致还原的信息有偏差,针对时域单通道音域信号分离问题,提出在对抗生成网络中引入联合训练与时序卷积的方法.首先,对时域语音预处理;然后,将预处理过的数据送入时序卷积生成对抗网络生成器中进行分离;最后,将分离的干扰语音和纯净的干扰语音送到生成对抗网络判别器判别,并把判别结果反馈给生成器.实验采用MIR-1K和data_thchs30数据集进行算法性能测试,实验结果表明,提出的单通道音域分离模型的PESQ和STOI指标平均提高了0.31和0.07,证明所提算法有效改进了音域信号中语音和音乐的分离效果.