摘要

语音情感识别是目前广受关注的人机交互的手段,具有重要的意义。为了解决目前语音情感识别效率低、识别准确率差等问题,通过增强卷积神经网络的特征提取能力,提出了一种基于图卷积神经网络的语音情感分类模型,该模型可以在卷积层之间进行集成以增强提取的特征。将特征增强模块置于特征提取网络中,提取更密切的谱图相关特征,从而提高复合模型的分类精度。结果表明,该模型与单一模型相比,在IEMOCAP英文情感数据库上的识别精度提升了1.13%~1.51%,F1提升可以达到3左右,验证了模型的有效性。

  • 单位
    辽宁工业大学