摘要

基于传统图像处理技术与流水线方式的化学结构图像识别方法通常依赖于人工设计的特征,导致识别准确率较低。针对该问题,提出一种基于空间注意力机制与通道注意力机制的化学结构图像识别方法。将化学结构识别视为序列生成任务,采用卷积神经网络(CNN)与长短期记忆(LSTM)网络相结合的深度神经网络模型实现化学结构图像到SMILES序列的转换。该深度神经网络模型由编码和解码两部分组成,编码部分使用CNN提取化学结构图像特征,解码部分融合双路注意力机制与LSTM网络生成SMILES序列。实验结果表明,该方法在Beam Size为3的情况下,识别准确率和BLEU-4值分别为81.63%和0.937,明显优于无注意力机制和单注意力机制的化学结构图像识别方法。

全文