摘要
针对传统的文章推荐方法存在的冷启动、用户反馈稀疏以及相似度衡量准确性欠佳等问题,本文提出了融合主题模型和预训练模型BERT的文章相似度计算模型(contextualized topic BERT, ctBERT).给定查询,该算法会计算查询与相关文章之间的相似度分数,文章经过预处理分别输入独立的子模块进行特征抽取并计算相似度得分,相似度得分与支撑集的个性化得分相结合以获得最终分数,该方法将单样本学习整合进推荐框架中,进一步取得了显著的改进.本文在3个不同的数据集上的实验结果表明,所提出方法在3个数据集上的NDCG标准均有提升,例如在Aminer数据集上NDCG@3和NDCG@5标准比对比方法分别提高了6.1%和7.2%,验证了该方法的有效性.
- 单位