基于改进PageRank算法的文献相关度排序方法

作者:聂永丹; 王斌; 张岩
来源:吉林大学学报(信息科学版), 2022, 40(03): 464-470.
DOI:10.19292/j.cnki.jdxxp.2022.03.006

摘要

科技文献检索时以专业角度给出合理的相关度排序是一项非常重要工作,传统PageRank算法采用了平均分配相似性权重的方式,但其会产生文献排序结果不合理的问题。为此,提出一种将深度学习方法与PageRank相结合的算法,提高文献相关度排序的可靠性。首先,使用具有注意力池化的孪生BERT(Bidirectional Encoder Representation from Transformers)深度学习网络计算文献与引文的相似度;然后,对文献与其所包含引文间的相似度进行规范化处理;最后,将标准化后的相似度作为分配权重对引文网络计算排序。实验结果表明,相较于传统的PageRank算法,该方法检索结果的相关度提升6%以上,因此更适合应用于科技文献的引文网络分析。

全文