基于多模语音信息互补与门控制的情绪识别方法

刘峰; 李知函; 齐佳音; 周爱民; 李志斌

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于多模语音信息互补与门控制的情绪识别方法

作者：刘峰; 李知函; 齐佳音; 周爱民; 李志斌

来源：2022-01-28, 中国, CN202210106236.8.

摘要

本发明提供的基于多模语音信息互补与门控制的情绪识别方法,属于多模态情绪识别技术领域,包括以下步骤：S1提取目标视频中的音频特征与文本特征；S2对音频特征与文本特征进行特征双向融合；S3通过可学习门控制机制调节S2中的双向融合的结果中融合表征的比例,并输出；S4对S3中可学习门控制机制的输出进行拼接,最终获得情绪类别输出。本发明将门控机制应用于交叉注意力模块,以决定是保留源模态信息还是覆盖目标模态信息,调节源模态信息和目标模态信息的比例,从而平衡了识别的准确率与模型的参数量。

单位
华东师范大学; 上海对外经贸大学

收藏分享被引浏览

更新时间：2024-11-29 00:55

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号