美尔谱系数与卷积神经网络相组合的环境声音识别方法

刘亚荣; 黄昕哲; 谢晓兰<sup>*</sup>; 刘鑫

doi:10.16798/j.issn.1003-0530.2020.06.025

摘要

通过对复杂环境下声音识别技术进行研究,本文提出了美尔谱系数(MFSC)与卷积神经网络(CNN)相组合的环境声音识别方法。对声音事件提取其MFSC特征,将特征参数作为输入送入设计好的CNN模型中对声音事件进行分类。实验数据集采用ESC-10,将构建的卷积神经网络模型与随机森林、支持向量机(SVM)、深度神经网络(DNN)及DCASE比赛中常用的三种识别模型进行对比实验。实验结果表明,在相同数据集下,本文所设计的美尔谱系数与卷积神经网络相组合的环境声音识别方法相较传统的声音识别方法在识别率上分别有13.1%,18.3%,15.7%的提升,相较于DCASE比赛中的三种常用识别模型,本文所设计识别模型识别率及识别效率均有明显的优势。

单位
桂林理工大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-13 16:45

美尔谱系数与卷积神经网络相组合的环境声音识别方法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友