摘要
提出了一种基于Seq2seq半指针半标注法的对输电规程文本实体关系进行联合抽取方法,构建了电力知识图谱。该方法首先使用指针网络解码提高实体抽取的准确性解决了关系抽取中实体边界模糊问题,共享编码层进行关系抽取解决了串联抽取方法误差积累的问题;然后采用查询匹配系数法,优化了三元组数据集的筛选与排序,提高了电力知识图谱的查全率和查准率。实验结果表明,在人工标注的电力领域关系数据库中测试集F1值达到0.837 6,在知识图谱查询测试实验中平均查准率和查全率达到了75%以上,验证了该方法在输电规程文本抽取的有效性,最后将抽取到的电力知识图谱以三元组形式存入图数据库Neo4j,实现数据查询可视化,为电网规程文本的准确查询提供了依据。
- 单位