基于对比学习和数据增强的零样本事件抽取系统及方法

作者:纪焘; 邱震宇; 朱冰; 朱德伟; 周一航; 张森辉; 孔维璟; 纪文迪; 吴苑斌; 王晓玲
来源:2022-03-07, 中国, CN202210229733.7.

摘要

本发明公开了自然语言处理技术领域的基于对比学习和数据增强的零样本事件抽取系统及方法,包括:获取数据集后,划分为已知事件和未知事件;重写未知事件的事件描述文本;将已知事件、未知事件和经过事件描述重写的未知事件组成正负样本对;将正负样本对输入事件编码器,生成对应的特征向量;基于特征向量计算对比损失函数值后,通过梯度回传更新事件编码器中的模型参数;基于更新后事件编码器输出的特征向量输入进行分类与聚类。本发明通过对比同类与异类样本的方式,充分利用已知事件的标注数据与未知事件的无标注样本,实现对未知事件类型的自动发现并归类。