摘要

词表和分类法是传统纸质文献环境下最重要的知识组织工具.它的更新和维护一直依靠手工进行.这限制了它在数字图书馆和网络信息环境下的应用.本文介绍了一项基于统计的、从元数据的标题中抽取关键词并定位在词表中的方法.定位的依据是抽取出的关键词所对应的标引词集的收敛性质.标引词是用于标引文献主题的、来自于词表的受控词汇,即主题词.在<中国分类主题词表>和北京大学图书馆提供的5千余条计算机科技领域的书目数据上

全文