摘要
针对传统协同过滤算法中存在数据稀疏性问题,提出融合协同过滤的线性回归推荐算法。根据用户对项目的评分以及用户和项目的自身特征,构建用户间和项目间相似矩阵。基于相似矩阵,选出用户和项目最近邻集合,分别通过基于用户和基于项目的协同过滤算法来预测用户已评分项目的评分,将预测评分与真实评分的差值作为特征,组合在一起生成新的训练数据。把新的训练数据作为线性回归模型的输入,根据训练好的模型预测未知评分,采用top-N算法产生推荐列表。在MovieLens数据集上进行实验,实验结果表明新算法的推荐准确性较传统协同过滤算法有显著提高。
- 单位