摘要
本文提出了一种基于FFTNet的生成对抗网络模型来实现极端音频超分辨率任务。生成器采用并行、非因果、Non-local运算的三路分裂求和FFTNet,此浅层模型速度快,精度高,能更好的提取时域音频的长期相关结构,以期望分辨率提取特征,提升重建性能;设计匹配性能的判别器,稳定适应生成对抗架构;融合基于频域的感知损失,与样本空间损失固定加权减少重建失真和提高感知质量。从主客观进行系统评价,本文方法都优于基线模型,从2x/4x/6x倍还原效果来看,模型具有极端的高频重建能力,有助于提高音频信号的时间分辨率。
- 单位