混合多尺度卷积结合双层LSTM语音情感识别

梁科晋; 张海军; 刘雅情; 张昱; 王月阳

摘要

针对深度学习算法在语音情感特征提取方面的不足以及识别准确率不高的问题，本文通过提取语音数据中有效的情感特征，并将特征进行多尺度拼接融合，构造语音情感特征，提高深度学习模型对特征的表现能力。传统递归神经网络无法解决语音情感识别长时依赖问题，本文采用双层LSTM模型来改进语音情感识别效果，提出一种混合多尺度卷积与双层LSTM模型相结合的模型。实验结果表明，在中科院自动化所汉语情感数据库（CASIA）和德国柏林情感公开数据集（Emo-DB）下，本文所提语音情感识别模型相较于其他情感识别模型在准确率方面有较大提高。

单位
新疆师范大学

收藏分享被引(1) 浏览

更新时间：2024-11-29 04:42

混合多尺度卷积结合双层LSTM语音情感识别

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友