视觉问答技术研究

俞俊; 汪亮; 余宙<sup>*</sup>

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

视觉问答技术研究

作者：俞俊; 汪亮; 余宙^*

来源：计算机研究与发展, 2018, 55(09): 1946-1958.

摘要

随着深度学习在计算机视觉、自然语言处理领域取得的长足进展,现有方法已经能准确理解视觉对象和自然语言的语义,并在此基础上开展跨媒体数据表达与交互研究.近年来,视觉问答(visual question answering,VQA)是跨媒体表达与交互方向上的研究热点问题.视觉问答旨在让计算机理解图像内容后根据自然语言输入的查询进行自动回答.围绕视觉问答问题,从概念、模型、数据集等方面对近年来的研究进展进行综述,同时探讨现有工作存在的不足;最后从方法论、应用和平台等多方面对视觉问答未来的研究方向进行了展望.

单位
杭州电子科技大学

收藏分享被引浏览

更新时间：2024-04-24 00:57

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号