摘要
为实现高速铁路道岔运维知识图谱的自动构建,从而为道岔智能运维提供决策支持,须利用知识抽取技术从高速铁路道岔运维文本中提取关键知识。同时,为进一步解决道岔运维文本中的实体嵌套与知识三元组重叠问题,提出一种基于多模块联合学习的高速铁路道岔运维知识抽取模型RTOM-KE。首先,依据定义的实体与关系类型,采用基于BIOES的两阶段知识标注策略,分别标注头实体以及相对应关系下的尾实体;其次,通过轻量级预训练模型BERT-base与双向长短期记忆神经网络BiLSTM构成的编码器模块获取文本的多维共享编码表示,将编码器模块的隐藏状态和全局上下文特征组合之后作为头实体抽取模块的输入;最后,通过头实体抽取模块提取文本中的所有候选头实体,同时,将候选头实体标签和来自编码器模块的多维共享词表征作为尾实体抽取模块的联合输入,通过特定的关系门机制筛选与头实体相关联的尾实体,从而获得高速铁路道岔运维知识三元组。通过充分的对比实验以及消融实验,结果表明:RTOM-KE模型能够较为精准全面地抽取不同复杂程度的三元组,有效解决实体嵌套与三元组重叠问题,基于道岔运维数据集的模型精确率、召回率与F1值分别可达88.3%、86.9%和87.6%。研究结果可为进一步构建高速铁路道岔运维知识图谱以及道岔智能运维提供支持。
-
单位卡斯柯信号有限公司; 兰州交通大学