摘要

针对传统的协同过滤推荐算法中评分矩阵过于稀疏和算法准确度不高的问题,提出一种融合矩阵分解和XGBoost算法的推荐算法(MFXGB, Matrix Factorization XGBoost),其特点是利用SVD++算法(SVD, Singular Value Decomposition)对用户-项目评分矩阵进行填充,避免过多的缺失值对算法精确度的影响,再利用XGBoost (eXtreme Gradient Boosting)算法训练有监督的模型用于预测用户评分。为了克服计算成本过高的困难,提出利用K-均值聚类方法进行特征提取用于训练XGBoost模型。将MFXGB算法应用于MovieLens数据集进行实验分析,结果显示,MFXGB算法的推荐精确度比传统的3种方法分别提高了8.91%、10.18%和11.79%,效果明显优于传统的推荐算法。