摘要
为实现电力设备铭牌中文字信息的自动识别,提升设备管理的效率,提出一种面向场景文字的文本内容识别方法。该方法依赖于从卷积特征中训练得到的基于长短时记忆网络的视觉注意力模型。一组特征向量从与图像不同区域相对应的卷积层提取,从而将图像的空间信息编码到特征中。基于分配注意力权重,模型可以选择关注图像的不同部分,并结合卷积特征与注意力权重识别文字。进一步引入语言模型并修改集束搜索策略可以显著改善识别效果。在真实数据集上的结果验证了该方法的有效性。
-
单位国网冀北电力有限公司