摘要
事件抽取作为信息抽取的任务之一,旨在从非结构化文本中抽取出结构化事件信息。当前基于机器学习和深度学习的自动化信息抽取方法过度依赖于标注数据,而大多数领域的标准数据集规模很小且分布不均匀,因此低资源场景成为限制自动化信息抽取性能的重要瓶颈。虽然,近年来众多学者针对低资源场景进行了深入研究,并产生了许多显著的成果,但目前针对该场景下的事件抽取研究综述比较缺乏。本文对现有的学术成果进行了较为全面总结分析,首先介绍了相关任务的定义,并将低资源场景事件抽取任务分为3类;之后围绕此分类重点阐述了6种相关技术方法,包括基于迁移学习、基于提示学习、基于无监督学习、基于弱监督学习、基于数据与辅助知识增强、基于元学习的方法,随后指出当前方法的不足和未来改进的方向;接着介绍了相关数据集及评价指标,并对典型技术方法的实验结果进行总结分析;最后从全局角度总结分析了当前低资源场景事件抽取工作面临的挑战及未来研究的趋势。
- 单位