基于交互式Transformer的图像-多语言字幕转换方法

胡珍珍; 徐月圆; 周愿恩; 洪日昌; 汪萌

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于交互式Transformer的图像-多语言字幕转换方法

作者：胡珍珍; 徐月圆; 周愿恩; 洪日昌; 汪萌

来源：2022-04-20, 中国, ZL202210418758.1.

摘要

本发明公开了一种基于交互式Transformer的图像-多语言字幕转换方法,其步骤包括：1.构建图像-多语言字幕数据集,2.获取图像的VinVL特征表示,3.获取文本的特征表示,4.采用图像特征与文本特征训练图像-多语言字幕模型,5.利用训练好的图像-多语言字幕模型,实现对图像的多种语言描述。本发明的文本信息涉及中英文两种语言,能够综合利用文本与视觉信息,实现图像到多语言字幕的转换,从而支持多种语言的高效转换。

单位
合肥工业大学

收藏分享被引浏览

更新时间：2024-11-29 01:18

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号