摘要
本文提出一种基于挤压和激励残差网络的歌声检测算法,运用该算法,不需要对音乐信号进行复杂的特征工程处理,仅需对网络输入简单朴素的声学特征,便能通过多层次卷积以及挤压和激励操作,学习到更多的有效特征,从而达到比当前流行的检测算法更强的性能.算法中,残差结构使得网络可以轻松扩展深度,挤压和激励模块能对深度残差网络中学习到的多个特征进行自动融合,进而使得学习到的歌声特征整体更有效.为了验证算法的可行性和有效性,本文选择了2个公开的数据集进行实验,并以目前性能最好的歌声检测框架之一作为基线系统,实验结果证明了本算法的性能领先于基线系统.
- 单位