融合空间注意力机制的图像语义描述算法

郭列<sup>*</sup>; 张团善; 孙威振; 郭杰龙

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

融合空间注意力机制的图像语义描述算法

作者：郭列^*; 张团善; 孙威振; 郭杰龙

来源：激光与光电子学进展, 2021, 58(12): 329-338.

摘要

图像语义描述模型通常采用编码器-解码器方式实现图像语义描述,模型存在对图像特征利用不充分,图像目标的位置信息提取不足等问题。针对此问题,提出在编码器部分融合注意力机制的图像语义描述算法,通过解码器上下文信息对不同图像特征的注意力权重分配,从而提高图像语义描述的表达能力。并在Flickr30k和MSCOCO数据集上进行了验证,模型在BLEU-4评价指标上分别提升了1.9%和0.8%,实验证明了本文算法的有效性。

单位
机电工程学院; 中国科学院福建物质结构研究所; 西安工程大学

收藏分享被引浏览

更新时间：2024-04-18 09:04

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号