摘要
近年来,随着国家经济的飞速发展,电力建设工程投资快速增加,电力建设工程标书数量及相应的工程标书评审工作量也急剧增加。传统的纯人工标书评审耗时、耗力且速度慢。要实现工程标书的机器自动评审,就需要对标书进行关键内容自动抽取和摘要,标书文本中的实体识别是关键步骤。鉴于工程标书中有很多非常用词语组合存在,现有的技术对工程标书中的地名等实体的识别效果并不理想。针对上述问题,本文提出并设计一种基于条件随机场的电力工程标书的实体识别技术方案,通过机器实现对标书的自动化快速处理,并帮助实现关键性工程的电子化评估和数据共享。该方法已在实验中证实了其有效性,并已被应用到电力领域的文件自动化处理事务中。
- 单位