摘要

社会化标签的相似性评估是基于标签的链路预测和个性化推荐的基础。针对以向量空间矩阵和基于图或网络的标签共现关系来度量标签之间相似性的现有方法存在的割裂社会化标签系统“用户-资源-标签”三元内在关系及语义联系丢失问题,本文引入能系统刻画“用户-资源-标签”三元内在关系的超网络模型,提出基于超网络的社会化标签相似性评估方法。该方法从用户的社会化标注行为入手,将标签表示为节点,把用户对资源标注表示为超边,构建社会化标签超网络。在此基础上,建立基于超网络的社会化标签相似性度量的两个基本原则:共有超边原则和超边包含节点数原则,并据此构建基于超网络的系列社会化标签相似性度量指标。选取代表性社会化标签应用数据集,利用链路预测的AUC和Precision评价方法对构建的相似性指标进行实验评估,实验结果表明,基于单纯共超边原则以及综合共超边与超边包含节点数原则构建的标签相似性指标优于基于标签共现网络构建的标签相似性度量指标,特别是在Precision评价方面提升明显。