摘要

为了提高RDF知识库的数据质量,提出RDF图数据的异常检测及其自动修复的方法。首先,原创性地定义了基于图的条件函数依赖(GCFD),能够将属性值和语义结构的依赖关系统一表示;然后,提出有效的算法框架以及优化策略,挖掘RDF数据中的GCFD,并给出异常数据的自动修复流程;最后,在真实的数据集上,通过大量实验确认解决方案的可行性和优越性。

  • 单位
    北京大学王选计算机研究所

全文