图像标题生成利用机器自动产生描述图像的句子,属于计算机视觉与自然语言处理的交叉领域。传统基于注意力机制的算法侧重特征图不同区域,忽略特征图通道,易造成注意偏差。该模型通过当前嵌入单词与隐藏层状态的耦合度来赋予特征图不同通道相应权重,并将其与传统方法结合为融合注意力机制,准确定位注意位置。实验结果均在指定的评估方法上有一定的提升,表明该模型可以生成更加流利准确的自然语句。