基于时频复值特征的多尺度扩张DenseNet条件源分离网络

作者:向进; 陈爱斌*; 彭伟雄; 温治芳
来源:郑州大学学报(理学版), 2023, 55(05): 60-66.
DOI:10.13705/j.issn.1671-6841.2022166

摘要

目前时频域音乐源分离方法大多基于幅度谱,这些方法忽略了相位信息而具有局限性。提出一种基于复值谱图的条件多尺度扩张密集卷积网络(C-MDilDenseNet)用于音乐源分离。首先,频谱图中时间轴和频率轴具有受音频速率和音调等独立影响而变化的声学特性,提出时频扩张密集块,有效增大了网络对频谱特征的感受野。其次,引入特征线性调制(FiLM)以扩展网络适应多源分离任务,并提出门控特征线性调制(GFiLM),从而更灵活、更有表现力地调节中间特征。最后,实验结果表明,在MUSDB18数据集的音乐源分离任务上,所提出的网络模型与基准模型相比,平均信号失真比提高了0.49 dB,与现有一些时域和时频域分离方法相比,具有更好的分离性能且参数量相对较少。

全文