摘要
将文本中识别出来的实体链接到具体的实体信息上,从而实现从字符串到信息的跳转,对许多应用来说至关重要。业内有许多机器学习或深度学习算法来实现实体链接,然而使用机器学习或者深度学习的方法实现链接需要大量的领域数据语料以及标注数据,对于敏感领域比较难实现。文章提出基于领域图谱的实体链接技术,首先融合了字面相似度、文本相似度、同义词集、字符包含等多方面相似性度量特征,其次将文本中的上下文实体在图谱中的关联性纳入链接的候选特征,实现领域实体的高效链接,并有效地解决了特殊领域训练语料难的问题。实验结果表明,该技术相对于一些传统方法在准确率和F值上表现更优。
-
单位中国电子科技集团公司第28研究所