摘要

基于邻域的协同过滤算法中,用户(项目)相似度的计算对预测和推荐结果有重要影响。传统相似度基于共同评分项目,能快速计算出相似度结果,但在稀疏数据下,推荐准确性较低。目前大多数改进的协同过滤算法通过制定较复杂的相似度公式,提高推荐准确性,但往往忽略了模型的计算时间。为达到在降低时间成本的同时执行有效的推荐,提出融合相似度和预筛选模式的协同过滤算法。首先在相似度模型中定义相对评分差异,并列举应满足的定性条件得到优化的相似度,同时考虑基于信息熵改进的评分偏好和用户全局评分的数量信息作为权重因子,更好地区分用户间差异,缓解稀疏数据下相似度计算不准确的问题。其次通过分析相似度模型和评分预测公式的隐式约束,提出预筛选模式,过滤掉大量无效的用户及对应的评分数据,进一步提高计算效率。最终通过融合相似度和预筛选模式得到协同过滤算法。在基准数据集上的实验表明,与其余8种算法相比,提出的算法具有良好的推荐质量和较高的时间效率。