摘要
作者识别是根据已知文本推断未知文本作者的交叉学科.其传统研究通常基于文学或语言学的经验知识,而现代研究则主要依靠数学方法量化作者的写作风格.近些年,随着认知科学、系统科学和信息技术的发展,作者识别受到越来越多研究者的关注.本文主要站在计算语言学的角度综述作者识别领域现代研究中的方法和思路.首先,简要介绍了作者识别的发展历程.然后,详述了文体风格特征、作者识别方法以及该领域中多层面的研究.接着介绍了与作者识别相关的一些评测、数据集及评价指标.最后,指出该领域存在的一些问题,结合这些问题分析并展望了作者识别的发展趋势.
- 单位