基于网络最大流的作者同名区分算法

作者:全锦琪; 傅洛伊; 甘小莺; 王新兵*
来源:上海交通大学学报, 2020, 54(02): 111-116.
DOI:10.16183/j.cnki.jsjtu.2020.02.001

摘要

为了降低不同学者实体之间的共享特征(如机构、发表会议等)给同名区分带来的影响,提出一种基于网络最大流的同名区分算法.该算法将论文实体及其特征融合成一张网络图,根据特征节点的被共享程度设定不同的容量,再计算论文节点间的最大流量,并基于最大流量进行层次聚类.实验结果表明:该算法在精准率和召回率上有较为均衡的表现,具有较好的综合性能.

全文