摘要

[目的/意义]针对现有的中医领域知识图谱来源于科技文献的知识相对缺少的问题,提出一套面向中医科技文献实体关系抽取的解决方案,补充中医临床研究知识库,为领域知识图谱构建提供数据基础。[方法/过程]针对中医科技文献,设计领域实体关系表示模型;并根据领域数据多标签和重叠的特点,将实体关系抽取任务分解为关系分类和实体识别两个子任务,将关系分类结果融入实体识别任务中,设计基于预训练模型BERT的实体关系抽取级联模型。[结果/结论]在自建中医科技文献信息抽取数据集(TCM-STD-IE)上进行实验验证,关系分类和实体识别的F1-micro分别为92.74%、93.58%。

全文