一种同伴知识互增强下的序列推荐方法

作者:胡开喜; 李琳*; 吴小华; 解庆; 袁景凌
来源:自动化学报, 2023, 49(07): 1456-1470.
DOI:10.16383/j.aas.c220347

摘要

序列推荐(Sequential recommendation, SR)旨在建模用户序列中的动态兴趣,预测下一个行为.现有基于知识蒸馏(Knowledge distillation, KD)的多模型集成方法通常将教师模型预测的概率分布作为学生模型样本学习的软标签,不利于关注低置信度序列样本中的动态兴趣.为此,提出一种同伴知识互增强下的序列推荐方法 (Sequential recommendation enhanced by peer knowledge, PeerRec),使多个具有差异的同伴网络按照人类由易到难的认知过程进行两阶段的互相学习.在第1阶段知识蒸馏的基础上,第2阶段的刻意训练通过动态最小组策略协调多个同伴从低置信度样本中挖掘出可被加强训练的潜在样本.然后,受训的网络利用同伴对潜在样本预测的概率分布调节自身对该样本学习的权重,从解空间中探索更优的兴趣表示. 3个公开数据集上的实验结果表明,提出的PeerRec方法相比于最新的基线方法在基于Top-k的指标上不仅获得了更佳的推荐精度,且具有良好的在线推荐效率.

全文