摘要

协同过滤中普遍存在评分矩阵的稀疏性问题,其直接影响评分预测的准确度.部分矩阵填充方法需要利用评分以外的文本信息,存在获取困难的问题.针对电影评分数据冗余且分布不平衡的特点,本文采用自编码网络来提取用户评分的隐含特征.所得特征一方面近似表达了评分信息;另一方面有助于将评分预测问题转换为多分类问题,从而得到解决.在此基础上,通过调整输入节点与隐层节点的连接状态,缓解了稀疏性对评分预测的影响.在Movie Lens数据集上的实验结果表明,本方法取得比SVD更低的MAE值,为处理评分冗余且分布不平衡的稀疏矩阵形成支撑.