摘要

传统方法评价结果高于MAP@all标准值,为了解决这一问题,提出了基于Hadoop技术的高校数字图书馆文献检索方法。运用Hadoop算法提取语义关键词,再根据文献检索关键词计算流程计算语义相似度。完成上述工作后,运用快速匹配法,获得每个主题关键字比重权值。考虑不同主题生成文档权值不同,构建文献检索模型,实现高效数字图书馆文献检索。由此,完成基于Hadoop技术的高校数字图书馆文献检索方法的设计。实验中,在ACM数字图书馆中选取数据40 000篇文献,用于评价两种方法的MAP@all值。实验结果表明,所提方法MAP@all值小于0.004 0,传统方法MAP@all值高于0.004 0。由此可知,所提方法的漏查率较低,符合设计需求。