摘要

目前知识图谱更新面临着更新知识数量大、频率高且包含大量错误信息的问题,现存的方法为保证更新效率对知识简单分类,判断方法单一且不考虑知识的语义关联,导致知识更新精确度低.本文提出一种基于标准模式挖掘的知识图谱更新方法,该方法与自动抽取并直接插入的方法不同,利用从现有知识图谱中挖掘出的标准模式进行模拟匹配来筛选正确的知识,并对标准模式挖掘算法进行了改进,提升了筛选的准确性.当大量知识同时进行更新时对挖掘出的标准模式和待更新知识同时向不同的领域空间向量化,计算两者间的向量距离,通过控制阈值筛选正确的知识.在真实的数据集上实验结果证明了本方法的准确性和有效性.

全文