摘要

[目的/意义]基于被引频次的传统引文分析法将所有引用同等看待,未能有效区分不同引用之间的差异。采用机器学习和自然语言处理技术对引用文本从不同角度进行自动分类,能够深入揭示文献之间深层次的引用关系。[方法/过程]首先对引用文本自动分类方法进行探索,采用传统机器学习和深度学习技术从引用功能和引用情感两个角度分别构建自动分类器。在此基础上,对计算机领域的1 738篇科学论文和一篇高被引论文的4 132篇施引文献两个语料集进行引用内容分析。[结果/结论]引用功能和引用情感间存在一定的相关性,并在论文中存在明显的位置分布特征;不同学科的施引文献对同一篇论文的引用在功能和情感上均存在显著差异。

全文