摘要

【目的】针对推荐系统的异构信息融合问题,提出融合标签和内容数据的矩阵分解方法 TCMF,减小预测误差,克服评分数据稀疏问题,提升矩阵分解算法鲁棒性。【方法】使用Embedding实现内容文本数据的结构化,使用卷积神经网络(CNN)提取深层次内容特征,利用深度神经网络(DNN)融合内容与标签信息得到综合特征,基于矩阵分解算法提出TCMF评分预测方法。在真实电影数据集上的实验进一步探究了不同特征融合方式、不同电影内容和正则化参数对算法预测性能的影响。【结果】在MovieLens-20m数据集上的实验显示,TCMF降低了电影评分预测误差,实现的最低RMSE为0.829 5,最低MAE为0.618 9,相比于对比方法在RMSE和MAE上的最高降幅达到9.62%和14.17%。【局限】由于缺少用户信息,TCMF在表征用户的个性化特征上有所欠缺。【结论】融合异构的标签和内容信息不仅能够降低用户评分预测误差,而且可以提高预测算法的鲁棒性。