摘要

变电站二次回路是二次高级集成业务的基础,采用图像识别技术对二次回路的自动特征识别、信息提取,可实现二次回路的智能运维业务。而变电站采集的图片环境背景杂乱、分辨率低以及失真,使得采用图像识别技术识别不规则文本极具挑战。因此,提出一种基于注意力机制的二次回路端子文本检测与识别方法。该方法主要包含预处理、文本检测和文本识别3个部分,其中文本识别部分提出一种时空嵌入编码方法,可以更好利用图片的位置信息。在训练过程中,相较未改进方法仅需要序列级的标注信息,而无需额外细粒度的字符级别框或分割掩码。最后,通过实际工作场景数据集证明该方法不仅易用、性能好,且在识别精度上也优于其他方法。

  • 单位
    内蒙古电力科学研究院

全文