摘要

语音情感识别是服务领域判别个体心理状态、提升服务质量的有效途径和关键技术之一。为方便分析与对比时频域的语音情感识别,设计了一维和二维深度卷积神经网络对语音信号及其声谱特征的提取。在完成有效情感特征的提取后,采用Softmax分类器鉴别语音情感。为避免过拟合的发生,提高网络的泛化性能,采用贝叶斯算法完成网络的训练及模型的生成。设计的两个深度网络在两个公开情感数据集都取得了较好的实验结果,其中二维卷积神经网络表现更为优异,从语音信号的倒谱系数中学习了更有效的情感特征,获得更高的识别率。