摘要
[目的/意义]引入时间衰减因子与聚类系数对共词网络链路预测局部相似性指标进行优化改进,以期进一步提升共词网络链路预测的精确度。[方法/过程]从3个角度来提升局部相似性指标预测精确度:一是引入时间衰减因子计算连边权重,对不同时间段的连边进行区别处理;二是结合聚类系数改进已有相关相似性指标,即利用节点邻域拓扑信息进一步区分不同节点对相似性的贡献;三是同时融合时间衰减因子和聚类系数进行指标优化改进。再以图书情报学领域为例构建共词网络,利用多种分类算法(如朴素贝叶斯、决策树、随机森林、SVM)预测和评估所改进指标的预测精确度。[结果/结论]引入时间衰减因子,指标WCN、WAA、WPA、WRA的预测精确度均得到了有效提升;结合聚类系数,指标CN、AA、RA、WCN、WPA、WRA和SA的预测精确度均得到了不同程度的提升;同时融合时间衰减因子和聚类系数,WCN、WAA、WRA的预测精确度得到了进一步的提升。由此可知,引入时间衰减因子或聚类系数均能在一定程度上提升共词网络链路预测相关指标的准确度。
- 单位