摘要

【目的】为缓解推荐系统中显式评分数据广泛存在的数据稀疏性和用户选择偏差问题,提出一种基于无趣项注入的评分数据填充模型。【方法】基于条件生成对抗网络框架构建通用的评分数据填充模型,使用去噪自编码器作为生成器以捕捉交互背后的非线性潜在因素并提高模型的鲁棒性。针对选择偏差问题,基于用户时点可见性挖掘无趣项,并通过修改掩膜机制注入模型中生成符合用户真实评分分布的数据。【结果】在MovieLens和Amazon CD数据集上的实验结果表明,经过数据填充后,ItemCF、BiasSVD和AutoRec算法的推荐精度平均提升了3倍以上。【局限】数据生成依赖于评分数据,无法有效应用于评分数据极度稀疏的冷启动场景。【结论】所提模型能够有效缓解数据稀疏性并消除选择偏差,显著提高现有协同过滤方法在推荐任务中的性能。