摘要

【目的】提出融合网络表示学习和作者主题模型的科研合作预测方法。【方法】基于经典网络表示学习方法计算得到作者节点的嵌入式向量表示,采用余弦相似度计算作者的结构相似性;基于作者主题模型计算得到作者的主题向量表征,采用Hellinger距离计算作者主题相似性。再将两种相似性方法进行线性特征融合,采用贝叶斯优化方法进行融合超参数选择。【结果】用NIPS论文数据进行实证研究,经过贝叶斯参数选择后效果最好的node2vec+ATM模型,预测的AUC值达到0.927 1,比基准模型提高0.185 6,也优于现有的一些融合外部信息的表示学习模型。【局限】仅考虑作者文章内容信息,没有将作者单位、地理位置等更多属性信息融入模型。【结论】本文提出的融合模型考虑了结构与内容特征,能够得到比简单网络表示学习更好的合作预测效果。