摘要
目前语音情感识别主要面临着的难题在关于语音声学特征与情感之间关系的研究成果缺乏一致性,同样的特征运用不同的库,识别结果会相差很大.使用支持向量机SVM作为识别机,通过BP神经网络进行特征选择,得到EMO-DB库特征组合的最高识别率为85.59%,得到CASIA库特征组合的最高识别率为74.75%.本文包含2个语音库,其中一个中文,一个德文.通过BP神经网络特征选择后,最优特征子集包含8个特征,将特征子集应用于EMO-DB库和CASIA库的混库实验的识别率为72.34%,并与近三年的文章进行了对比分析,本文的实验结果处在较高的水平.
-
单位电子工程学院; 广西师范大学