摘要

【目的】解决基于显式反馈信息的协同过滤算法无法处理数据稀疏性和用户选择偏差影响的问题。【方法】根据看见但未交互的项目表现用户的负面偏好,结合用户活跃度、项目流行度和时间因素综合衡量用户对项目的可见性。引入使用前偏好的概念,构建基于用户时点可见性的加权矩阵分解模型以识别缺失数据中用户不感兴趣的项目,并将其填充为低值。【结果】通过在MovieLens两个数据集的实验表明,经过基于无趣项挖掘与低值填充的数据填充算法(UIMLF)填充后,ItemCF和BiasSVD的推荐精度平均提升2~2.5倍。【局限】仅依据“看见未交互”的项目表现用户负面偏好的经验对使用前偏好建模,可能存在经验偏差。【结论】所提方法能有效缓解数据稀疏性和用户选择偏差的影响,使推荐结果更准确。