结合新颖的互注意力和门控机制的图像标题生成

胡卫兵; 米金鹏; 吴旭明; 刘丹; 杨芳艳

doi:10.20009/j.cnki.21-1106/TP.2021-0989

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

结合新颖的互注意力和门控机制的图像标题生成

作者：胡卫兵; 米金鹏; 吴旭明; 刘丹; 杨芳艳

来源：小型微型计算机系统, 2023, 44(08): 1785-1791.

DOI：10.20009/j.cnki.21-1106/TP.2021-0989

摘要

图像标题生成是通过机器产生描述图像的语句，属于多模态领域的重要研究方向之一.现有的工作大多数有两点不足：1)采用单一的图像特征，导致在非结构化场景中无法完全描述图像中更加细粒度的内容信息；2)模型大多数完全依赖图像的特征生成句子，而没有引入外部知识作为辅助信息.针对上述两点，提出一种互注意力和门控机制的方法.在MSCOCO2014数据集上和Flickr 30k数据集上分别进行实验，结果在各项指标上相较于主流模型均有一定的提升，表明该方法对图像内容的理解更加全面且生成的句子更加丰富.

单位
上海理工大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-19 02:50

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号