摘要

电力技术专业领域的信息萃取的效率提升问题受到越来越多的关注。针对这一关键问题,采用融合全文抓取与文件解析、OCR、专业领域的语言模型、命名体识别、textRank等关键技术,提取了一种新的信息萃取算法。通过多人盲评等实验环节,证明了本算法的有效性。

  • 单位
    国家电网有限公司

全文