摘要
电力工作票中包含的电力作业关键信息是进行作业前风险评估的重要基础,为了快速且准确地从实际工作票文档中提取所需信息,提出一种电力工作票分割与作业信息提取方法。首先,采取二值化、膨胀和腐蚀等操作从电力工作票图像中提取表格框线;然后,基于框线检测结果对工作票进行分割操作得到单元格图片,再使用光学字符识别方法(OCR)检测各单元格内对应的作业信息;最后,基于正则匹配方法对识别结果进行结构化处理,实现电力作业信息的有效提取与匹配。基于实际多任务工作票的实验测试表明,所提方法能将提取到的电力作业信息按所属单元格进行合乎上下文语义的组合,关键信息识别效果优于通用商业OCR软件。
- 单位