摘要

面对信息过载的深化和交叉研究的兴起等问题,提升信息检索系统的过滤能力是提供有效的检索词推荐服务等相关研究的重要议题。本文提出将PageRank算法与依存句法网络融合进行知识库的检索词推荐,通过构建检索词集合与依存句法网络,采用PageRank算法对检索词排序以实现检索词推荐,用Web of Science中124516篇information science&library science (LIS)领域的文献摘要数据对该方法进行验证。邀请10位LIS领域的图书情报专业硕士研究生进行用户研究,并与已有的相似方法和系统对比。研究结果显示,本文方法推荐准确率为80%,推荐列表表内平均Cosine相似性为0.530,表内平均Jaccard相似性为0.395,表内检索词具有较相似系统更优的多样性和惊喜度等特征,说明该方法能够扩大推荐检索词对用户信息需求的覆盖面,可为信息检索结果的表现方式提供新的参考方法和视角,可直接用于信息检索的后端词汇组织方式,也可间接用于知识发现与跨学科研究。

全文