摘要
针对刊物投稿推荐算法总是单独考虑文本主题或者作者历史发刊记录,导致刊物推荐结果准确率低的问题,提出了一种基于作者偏好的学术刊物投稿推荐算法。不仅协调使用了文本主题和作者历史发刊记录,还挖掘了学术刊物关注点与时间的潜在联系。首先,使用潜在狄利克雷(LDA)主题模型对文章标题进行主题提取;其次,建立主题-刊物和时间-刊物的模型图,采用大规模信息网络嵌入(LINE)模型学习异构图节点的嵌入;最后融合作者的主题偏好和历史发刊记录计算刊物的综合得分。据此,对投稿作者进行刊物投稿推荐。在两个公开数据集DBLP和PubMed上的实验结果表明,相比奇异值分解(SVD)、DeepWalk、非负矩阵分解(NMF)等6个算法,提出的模型在不同召回率的情况下均优于其他6个算法,在需要从论文和知识库中获取更少信息的同时,还保持了较高的准确性,能有效提高刊物推荐算法的鲁棒性。
- 单位