摘要

【目的/意义】引用动机不同会导致一篇论文在多次被引用时的引用主题和重点产生差异,识别这些被引主题并分析其变化,有助于引用动机分析,提高文献推荐效果。【方法/过程】本文首先抽取被引文献的上下文语境信息,根据文本长度界定多种引用内容的划分范围;然后结合多种文本聚类方法,识别被引主题并比较其异同;最后通过时序比较,分析被引主题的演化路径和过程。【结果/结论】选取人工智能研究领域中的代表性高被引论文进行分析,发现前后句是对当前引用句的重要补充,引用句及其前后句组合能够更好地揭示被引主题;基于引用内容的被引主题呈现出多样化的特征,揭示了原文内容的扩展和引用动机的差异;被引主题演化分析能够有效地揭示原文内容被应用或改进的方向、主题、方法和技术。【创新/局限】形成基于引用内容聚类的文献被引主题识别及其演化分析框架,证明被引主题的差异化以及对原文的补充作用,同时揭示引用内容的主题时序变化的特征与现实意义,后续有必要扩大研究样本,使得研究结果具有更好的通用性。