摘要
针对现有模型声音分类精度不足的问题,提出了一种基于多特征双二流网络的D-S融合模型。首先,提出了四种组合特征来更全面有效地表征声音。其次,提出双二流网络结构来更好地训练模型。第一和二流网络采用多分辨率多通道特征送入二阶密集卷积网络(2-DenseNet),其中2-DenseNet被分成了两个密集块。第三和四流网络采用单分辨率单通道的特征拼接送入四层CNN。然后利用D-S证据理论对softmax层的输出结果进行融合,得到D-S-Net模型。实验结果表明,基于UrbanSound8k数据集,经数据增强后该模型的准确率达96.36%,较基线提高了25.34%,并验证了在噪声环境下的鲁棒性,在20 dB信噪比下具有90.34%的识别率,在低信噪比下的性能得到了很好的提升。
-
单位河北工业大学; 电子信息工程学院