摘要

图像是人类获取信息的主要渠道,机器的自动描述图像(Image Captioning)能力是人工智能的一个重要研究课题,它结合了人工智能最重要的两个领域:机器视觉和自然语言处理。本文利用深度循环架构构建了一个中文图像描述的自动生成模型,分为特征提取层和语言生成层,先基于DCNN深度卷积网络的VGG网络对输入的图像进行编程,提取每个特征中所包含的信息量,然后使用LSTM来学习和生成描述图像的自然语言。