摘要
[目的/意义]引文情感识别是全文本计量时代引文内容分析的重要研究议题之一,它与引文动机/功能识别、引文主题分析、引文摘要自动生成等存在较强的关联性,可为学术评价、知识图谱构建/绘制等问题的解决提供有效的研究支撑,具有较高研究价值。[方法/过程]通过文献调研分析,从引文语料集创建、情感词典使用、情感识别算法应用及存在问题4个方面,对国内外引文情感识别的研究进展进行全面梳理和分析评述。[结果/结论]引文情感识别已从早期的基于情感词典方法发展到当前基于机器学习算法的新阶段,并正由传统机器学习进一步向深度学习推进。亟待解决的主要问题有:①缺乏大规模高质量的引文语料集,对引文语料蕴含的特有价值(引文特征)的挖掘利用严重不足;②情感词典方法严重依赖情感词典自身的完备性,机器学习算法(分类模型)的参数优化及识别效果仍有提升空间,对两类方法的有机融合利用尚需深入探索;③更细粒度和更多维度的引文情感识别研究及相关应用实践有待进一步拓展和深化。
- 单位