基于MLL和ASCA-FR的图像字幕生成方法

何立火; 李琪琦; 高新波; 蔡虹霞; 路文; 张怡; 屈琳子; 钟炎喆; 武天妍

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于MLL和ASCA-FR的图像字幕生成方法

作者：何立火; 李琪琦; 高新波; 蔡虹霞; 路文; 张怡; 屈琳子; 钟炎喆; 武天妍

来源：2018-12-26, 中国, ZL201811603384.0.

摘要

本发明公开一种基于多尺度学习MLL和相邻时间节点联合注意力机制特征重建ASCA-FR的图像字幕生成方法,主要解决现有技术中注意力模型在某时刻的输出仅考虑图像的特征集合和前一时刻的单词向量,只使用交叉熵损失函数训练网络所带来的生成字幕描述不准确、表述不流畅的问题。本发明的具体步骤如下：(1)生成自然图像测试集和训练集；(2)提取特征向量；(3)构建ASCA-FR网络；(4)训练ASCA-FR网络；(5)获得自然图像字幕；本发明利用MLL损失函数对构建的ASCA-FR网络进行训练,使得生成的字幕描述准确且表述流畅。

单位
西安电子科技大学

收藏分享被引浏览

更新时间：2024-07-23 08:34

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号