图像与问题双引导注意力机制视觉问答算法

陈婷; 王玉德; 任志伟; 杨昊; 高张弛

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

图像与问题双引导注意力机制视觉问答算法

作者：陈婷; 王玉德; 任志伟; 杨昊; 高张弛

来源：通信技术, 2022, 55(01): 36-42.

摘要

针对视觉问答任务中问题特征与图像特征缺乏交互推理关系的问题,提出了图像与问题双引导注意力机制视觉问答算法。模型结构主要由问题特征注意力模块、图像特征注意力模块、问题与图像双引导注意力模块、特征融合模块4部分构成。该算法先针对问题特征和图像特征分别使用自我注意力机制实现特征的自我加强,然后引入图像与问题双引导注意力机制,最后使用线性分类器分类输出。在VQA V2.0数据集上实验验证,该算法表现出较好的性能,准确率达到70.98%。

单位
曲阜师范大学

收藏分享被引浏览

更新时间：2024-03-19 13:06

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号