摘要

针对传统的链路预测在不同结构特征的网络中存在计算结果不稳定的问题,提出了基于信息熵改进主成分分析(PCA)模型的链路预测算法。本文首先用随机森林确定7个相似性指标作为最佳特征集合;然后,根据组合的思想将七个相似性指标组合在一起提出基于信息熵改进主成分分析(PCA)的特征信息融合模型,并对特征信息赋予权重,与单机制算法结合,在6个真实数据集上验证模型的正确性以及校验效果;最后,通过与混合链路预测算法比较曲线下面积(AUC)值来验证基于模型的链路预测算法的可行性和有效性。实验结果表明,与目前已有的算法相比,本文提出的链路预测算法对比基于有序加权平均算法(OWA)和集成模型链路预测算法(EMLP)算法在AUC精度上分别提升了2.5~12.46个百分点和0.47~9.01个百分点,具有较好的稳定性和准确性。将该算法应用到不同结构特征的网络中得到更稳定、更准确的链路预测结果。