面向深度学习的视觉问答技术的分析

作者:王青青; 郭星晨; 王亚*
来源:阜阳师范大学学报(自然科学版), 2020, 37(04): 71-76.
DOI:10.14096/j.cnki.cn34-1069/n/1004-4329(2020)04-0071-06

摘要

随着深度学习在计算机视觉和自然语言处理领域不断推广应用,跨视觉领域和自然语言学科的视觉问答技术成为近年来研究热点。当输入图像和自然语言问题时,视觉问答技术能够理解图像和问题中的信息自动回答问题。文章梳理近年来视觉问答技术的研究进展,分析了视觉问答技术的工作机制、模型的分类和公用数据集的特点,总结了目前研究工作的不足及发展方向。

  • 单位
    阜阳师范大学