摘要

命名实体分类和识别是自然语言处理中的关键任务,识别效果将会影响许多下游任务的性能。本文基于现有知识图谱,提出了图情领域9大类实体,并构建了适用于图情领域实体识别的LISERNIE模型。通过开展广泛的实验,结果表明,在预训练阶段注入了图情领域知识的LISERNIE模型能有效识别出命名实体,并且在小规模标注数据集上具有明显的性能优势,在应用到后续的开放域关系抽取实验中,其准确率远高于CORE系统,为进一步构建如知识图谱、问答系统、机器阅读等提供数据支撑。