摘要

针对交通场景复杂多变,主要体现在道路拓扑结构复杂、道路元素和交通参与者类型的多样性问题,提出一种基于注意力机制的图像描述生成算法。在算法的编码阶段,利用卷积神经网络提取图像不同区域的图像特征,每个区域融合注意力机制用来获取具有注意力权值的图像特征,突出图像中的重点信息。解码阶段,利用多个长短期记忆网络模块作为交通场景图像描述生成任务的语言模型。实验结果表明:在MSCOCO验证数据集中,该算法在评估指标BLEU-1至BLEU-4上分值分别为0.735、0.652、0.368和0.323,所提算法能够很好地描述交通场景图像。