摘要

【目的】根据文献内容划分学科属性以满足基于单篇文献学科分类的跨学科测度需求。【方法】基于鲁汶-布达佩斯(Leuven-Budapest)学科分类体系,根据15个一级学科的期刊文献摘要信息,选取机器学习、深度学习、预训练语言模型等自动分类领域中使用较广泛的三类方法对期刊文献进行分类,并根据改进后的SCIBERT模型的学科分类结果对15个一级学科进行跨学科测度分析。【结果】改进后的SCIBERT模型自动分类效果最好,平均F1值为81.45%,个别类别的分类效果达到90%以上;15个一级学科中生物医学研究跨学科程度最高为0.38,物理学跨学科程度最低为0.08。【局限】从文本内容视角考量跨学科测度,未结合其他视角引入多维跨学科测度指标进行全面测量,未引入多种方法进行跨学科性测度。【结论】预训练模型在期刊文献的自动分类领域效果最优,深度学习模型次之,机器学习模型的期刊文献自动分类效果最差;利用自动分类的方法面向文献内容进行跨学科测度,拓宽了当前跨学科测度的研究体系,有助于多角度、深层次的理解跨学科研究。