路径语义和特征提取相结合的负样本推荐方法

作者:马腾; 熊熙*; 李中志; 李斌勇; 昌燕
来源:小型微型计算机系统, 2023, 44(02): 349-355.
DOI:10.20009/j.cnki.21-1106/TP.2021-0577

摘要

随着大数据领域的飞速发展,数据成了当今各行各业宝贵的财富.从海量数据中筛选出合适的内容推送给不同用户,提高用户体验度是推荐系统的主要研究内容.但由于当前的负样本采样方式不足以产生优质的负样本,从而导致系统不能反映用户的真实需求.本文提出一种基于知识图谱的负样本采样算法:首先将TransR与SDAE(堆栈去噪自编码器)结合,从知识图谱的关系中获取编码以充分利用图谱中的信息.再将负采样算法找到的负样本排序,修剪掉得分低的负样本.为了提高搜索性能,在采样器中增加了通道注意力机制.本模型在Amazon-book, Last-FM,Yelp2018共3个数据集上与其它算法进行了比较.实验结果表明:1)在召回率方面,3个数据集上的负样本采样有效性比目前表现最好的DNS高出1.12%,2.12%,2.13%.2)与其它知识图谱推荐算法相比,本文提出的模型NSEP(Negative Sample Extraction combining Path semantics and feature extraction)提高了2.40%、3.41%和3.25%.3)通过对NSEP提出的模块进行消融性实验,发现各模块对算法都有积极贡献.

全文