摘要
针对航空发动机故障领域知识图谱构建过程中实体抽取的需要,构建了相关数据集,提出了一种融合字、词序列信息的Lattice Transformer-CRF实体抽取方法。该方法先是通过lattice结构,将字、词序列信息同时作为输入,通过Transformer模型进行特征提取后,将信息输入到CRF模型中进行序列标注,从而得到最优解。实验结果表明:在方法有效性验证中,与其他方法对比,在公共数据集上,所提方法的精确率、召回率和F值均取得了较高的得分;在方法适用性验证中,所提方法F值达到了95.02%,表明该方法可解决领域文本实体的自动抽取问题,且相较于其他4种传统方法更为先进、鲁棒性更强。
- 单位