注意力机制融合前端网络中间层的语声情感识别

朱应俊; 周文君; **; 马建敏<sup>*</sup>

摘要

为了使机器能够更好地理解人的情感并改善人机交互体验，可对语声特征及分类网络进行融合以提升情感识别性能。该文从网络融合的角度，把基于梅尔倒谱系数和逆梅尔倒谱系数的二维卷积神经网络和基于散射卷积网络系数的长短期记忆网络作为前端网络，提取前端网络的中间层作为话语级的特征表示，利用压缩-激励(SE)通道注意力机制对前端网络的中间层的权重进行调整并融合，然后由深度神经网络后端分类器输出情感分类结果。在汉语情感数据集中进行五折交叉验证的对比实验，实验结果表明，基于SE通道注意力机制的网络融合方式可以有效地利用不同前端网络在语声情感识别任务中的优势，提高语声情感识别的准确率。

单位
复旦大学

收藏分享被引浏览

更新时间：2024-03-15 16:59

注意力机制融合前端网络中间层的语声情感识别

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友