摘要

[目的/意义]针对用户在图书馆海量数字资源中常常面临获取信息困难的问题,构建一套个性化知识服务系统,认为该系统是图书馆帮助用户摆脱信息超载困境和提升知识服务质量的必然选择。[方法/过程]通过建立中图法和学科分类法两大知识组织体系的映射模型,基于Hadoop分布式处理平台,提出一种改进TF-IDF+贝叶斯算法构建图书馆海量学术资源自动分类模型,辅助完善图书馆个性化知识服务系统的构建。[结果/结论]以自中国知网抓取的600万余篇文献作为原始训练语料(语料涵盖75个学科)测试该分类模型的有效性,实验结果证明该模型的分类效率和效果都达到了预期。

全文