基于主题模型的百科知识库实体对齐

作者:刘振鹏; 贺梦洁; 张彬*; 董静; 徐建民
来源:计算机应用研究, 2019, 36(11): 3286-3343.
DOI:10.19734/j.issn.1001-3695.2018.05.0305

摘要

针对传统实体对齐方法无法体现潜在语义信息的问题,对其进行优化,使实体对齐效果更加显著。使用潜在狄利克雷分配(latent Dirichlet allocation,LDA)模型对网络百科非结构化数据进行建模,采用改进的置信传播(belief propagation,BP)算法求解LDA模型中的隐藏参数,进而生成实体特征向量进行相似度计算,通过计算结果判断是否可以对齐。实验结果表明,通过与三种传统算法进行比较,所提算法在准确率、召回率和综合指标F值三个评价指标方面均有所提高。针对具有描述信息的网络百科实体,该算法可以有效提升实体对齐效果。

全文