基于嵌入注意力机制层级LSTM的音视频情感识别

刘天宝; 张凌涛<sup>*</sup>; 于文涛; 魏东川; 范轶军

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于嵌入注意力机制层级LSTM的音视频情感识别

作者：刘天宝; 张凌涛^*; 于文涛; 魏东川; 范轶军

来源：激光与光电子学进展, 2021, 58(02): 183-190.

摘要

对于语音的情感识别,针对单层长短期记忆(LSTM)网络在解决复杂问题时的泛化能力不足,提出一种嵌入自注意力机制的堆叠LSTM模型,并引入惩罚项来提升网络性能。对于视频序列的情感识别,引入注意力机制,根据每个视频帧所包含情感信息的多少为其分配权重后再进行分类。最后利用加权决策融合方法融合表情和语音信号,实现最终的情感识别。实验结果表明,与单模态情感识别相比,所提方法在所选数据集上的识别准确率提升4%左右,具有较好的识别结果。

单位
中南林业科技大学

收藏分享被引浏览

更新时间：2024-04-18 08:31

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号