摘要

个性化的新闻推荐技术对于缓解信息过载和提高用户体验具有重要意义。新闻推荐模型通常基于固定数据集进行迭代训练,然而在现实场景下,新闻推荐模型需要不断学习以适应新的用户和新闻。为此,增量学习被提出用于帮助新闻推荐模型进行增量更新。新闻推荐模型增量学习的主要挑战为灾难性遗忘问题,即模型会忘记它之前学习过的用户偏好。鉴于此,本文提出基于自监督学习和数据回放(Self-supervised Learning and Data Replay)的新闻推荐模型增量学习方法 SSL-DR。SSL-DR首先在新闻推荐任务中加入自监督学习任务来获取用户的稳定偏好,有效减轻灾难性遗忘问题。为了巩固已学知识,SSL-DR进一步通过基于用户对于候选新闻的点击概率分数的采样策略实现数据回放,同时借助知识蒸馏策略转移已学知识。实验结果表明,本文方法可有效提升新闻推荐模型在增量训练过程中的整体推荐性能,明显缓解灾难性遗忘问题。