基于双向椭圆局部二值模式的环境声音分类

作者:李军; 王子壬; 董红亮; 钮焱*
来源:国外电子测量技术, 2023, 42(08): 63-70.
DOI:10.19652/j.cnki.femt.2304960

摘要

针对目前机器学习算法在环境声音分类准确率不高,训练速度慢的问题,提出了基于双向椭圆局部二值模式的环境声音分类方法。设计了双向椭圆局部二进制模式的音频信号特征提取方法,采用3×5信号邻域增加时长影响,并使用邻域左右两列整体平均值分别代替椭圆左右顶点像素,减少噪音干扰,提高对噪音的鲁棒性,使用整个邻域的平均值代替中心像素,并采用双向局部特征均衡顺序权重,在上述特征基础上增加VAR算子,反应局部特征差异强度,之后将这些特征与梅尔频率倒谱系数(MFCC)、伽玛频率倒谱系数(GFCC)和色度特征(Chromagram)融合。采用经典机器学习算法,如支持向量机(SVM)、随机森林(RF)和k近邻(kNN),结合融合特征,在ESC-10和ESC-50数据集上进行评估,两种数据集的分类准确度分别达到了90.9%和66.7%。

全文