基于二阶差分MFCC深度学习的声景基调声分类方法

作者:邓志勇; 张万亿; 刘爱利*
来源:中国传媒大学学报(自然科学版), 2023, 30(05): 26-54.
DOI:10.16196/j.cnki.issn.1673-4793.2023.05.002

摘要

本文提出了一种可用于卷积神经网络分类技术的二阶差分MFCC特征,尝试解决声景学中基调声与非基调声二分类这一具有“人文色彩”的主观分类任务。以老北京中轴线的声景样本数据集为例,根据本文设计的网络模型结构,使用该二阶差分MFCC特征训练的二分类器对于声景基调声的识别准确率达到80.23%,远优于单独使用RMS和Mel频谱特征,以及联合使用RMS与二阶差分MFCC特征的准确率。

全文