摘要

为提高智能语音情感识别系统的准确性,提出了一种基于卷积神经网络CNN(Convolution Neural Network)特征表征的语音情感识别模型。该卷积模型以Lenet-5模型为基础,增加了一层卷积层和池化层,并将二维卷积核改为一维卷积核,将一维特征预处理后,输送进该模型中,对特征变换表征,最后利用SoftMax分类器实现情感分类。CASIA与EMO-DB公开数据库上的识别结果显示:与Lenet-5网络相比,所设计网络模型的准确率分别提升了1.3%与2%,与Softmax分类器相比,准确率分别提升了3.8%与6.1%。仿真结果验证了网络模型的有效性。