摘要
民间文学是中华文化的重要组成部分,具有重要的研究价值。随着人工智能的快速发展,数字化技术成为修复民间文学残缺作品、构建民间文学领域知识图谱等实际应用的重要方式.然而,民间文学文本中指示代词多、实体关系重叠,使得民间文学文本关系抽取困难.为此,提出一种基于指代消解的实体关系联合抽取方法CR_RSAN,使用指代消解获取指示代词和对应实体的位置信息,并利用该信息设计指示代词替换算法和调整文本序列标注方法,以此强化模型获取文本语义特征的能力.此外,使用同时编码实体和关系信息的序列标注方法以缓解文本实体关系重叠问题.对比实验选用目前主流方法的模型作为基线,并相继在民间文学文本上进行实验,CR_RSAN在精确率、召回率和F1值等方面分别提高了13.39个百分点、14.29个百分点和14.98个百分点.
- 单位