摘要
词袋模型是一种最原始且普遍适用的关联数据融合算法,但是该算法中关键词匹配未利用自身语义以及语料库不足等现象,造成实体链接准确率不高。本文提出使用知识库作为背景,利用语义扩展和循环迭代来增强实体消歧的速度和准确率。该算法分为两个过程,首先对关联数据集进行初步的语义融合,然后在此基础上,利用本文提出的语义循环迭代词袋(s-i-Bo W)算法实现实体的消歧与链接。实验通过与基于传统词袋算法的关联数据融合进行了对比,证明了本文提出的语义循环迭代词袋算法具备更优的关联数据融合效果。
-
单位上海外国语大学; 上海财经大学