文本特征提取的研究进展

作者:曾明睿; 袁梦奇; 邵曦; 鲍秉坤*; 徐常胜
来源:南京信息工程大学学报(自然科学版), 2019, 11(06): 706-715.
DOI:10.13878/j.cnki.jnuist.2019.06.008

摘要

文本理解是人工智能的一个重要分支,其技术推动了人与计算机之间在自然语言上的有效交互.为了让计算机准确地理解和感知文本数据,文本特征提取是最为基础和关键的步骤之一.基于此,本文介绍文本特征提取研究的发展历史,以及近年来主流特征提取的方法,并对未来的研究方向进行展望.首先,介绍语义最底层的词级表示;接着,总结在词级表示基础上衍生出的句级表示上的研究进展;随后,介绍比词级表示和句级表示更高层的篇分析;最后,通过文本特征提取的一个典型应用——问答系统的介绍,阐述文本特征提取的最新方法和技术在问答系统上的应用,并对未来的研究方向做了展望.