摘要

在推荐系统中,针对推荐准确度问题,提出了一种融合协同过滤和CatBoost的混合推荐算法(UCF-CB)。在协同过滤模块中对用户相似度计算公式进行改进,加入时间衰减因子以及热门物品惩罚项,利用改进后的协同过滤算法对用户项目评分矩阵进行评分预测,得到用户对物品的一次评分。对协同过滤一次评分进行降序排序,选取评分最高的前k项物品,形成召回集。对原始数据集进行预处理,挖掘潜在特征增加特征维度,利用CatBoost算法对用户和项目特征进行训练,对召回集数据进行预测,得到二次评分预测。对于没有评分记录的新用户,利用训练好的CatBoost算法可以直接进行评分预测,在一定程度上解决了推荐系统冷启动的问题。将协同过滤一次评分以及CatBoost二次预测评分进行加权融合得到更为精确的推荐结果。在movieslens(ml-1m)数据集上的实验结果表明,该算法可以获得较高的准确度。