CNN图像标题生成

作者:李勇; 成红红; 梁新彦; 郭倩; 钱宇华
来源:西安电子科技大学学报, 2019, 46(02): 152-157.
DOI:10.19665/j.issn1001-2400.2019.02.025

摘要

图像标题生成任务需要生成一个有意义的句子来准确地描述该图像的内容,而现有研究通常采用卷积神经网络编码图像信息、循环神经网络来编码文本信息,由于循环神经网络的"串行特性",导致模型的性能低。为解决该问题,基于卷积神经网络来构建一种模型,采用不同结构的卷积神经网络来同时处理两个模态的数据,得益于卷积运算的"并行特性",该模型的运行效率有明显提升。在两个公开数据集上进行了实验,实验结果在指定的评价指标上也有一定的提升,表明了该模型对于处理图像标题生成任务的有效性。

全文