基于时序卷积生成对抗网络的单通道音域分离

郁文虎; 全海燕

摘要

由于音域信号的语音和音乐常常以混叠的形式出现，因此在许多应用中，希望有效分离出音域信号中的语音和音乐.普通的分离方法一般采用基于频域信号的处理方式.而频域信号还原时需借助相位信息，导致还原的信息有偏差，针对时域单通道音域信号分离问题，提出在对抗生成网络中引入联合训练与时序卷积的方法.首先，对时域语音预处理；然后，将预处理过的数据送入时序卷积生成对抗网络生成器中进行分离；最后，将分离的干扰语音和纯净的干扰语音送到生成对抗网络判别器判别，并把判别结果反馈给生成器.实验采用MIR-1K和data＿thchs30数据集进行算法性能测试，实验结果表明，提出的单通道音域分离模型的PESQ和STOI指标平均提高了0.31和0.07，证明所提算法有效改进了音域信号中语音和音乐的分离效果.

单位
自动化学院; 昆明理工大学

收藏分享被引浏览

更新时间：2023-02-09 12:12

基于时序卷积生成对抗网络的单通道音域分离

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友