摘要
在基于邻域的协同过滤算法中,相似度和评分预测方法的设计是其核心步骤.由于数据稀疏问题,导致所选邻居的质量和评分预测能力受到较大影响.针对以上问题,提出面向稀疏数据的物品相似度和评分预测算法.首先,根据模糊集和推荐系统的关联,从用户偏好概率的角度提出基于Vague集的KL(Kullback-Leibler)散度,以衡量物品相似度.其次,定义权重因子α,强调评分数量信息的重要性,进一步提高相似度计算的准确性.最后,提出改进的评分预测方法,整合更多的评分信息来调整预测结果,提高稀疏数据下评分预测的能力.在基准数据集上的实验表明,与其余代表性算法相比,本文方法具有较高的预测和推荐质量,并有效缓解了数据稀疏问题.
- 单位