摘要

开放信息抽取(Open IE)是自然语言处理(NLP)的核心任务。尽管在这方面工作投入很多,但仍有许多问题需要解决。传统的开放式信息抽取方法使用一组手工定制的抽取模式从语料库中提取关系元组。同时,在程序中使用了许多自然语言处理工具;因此,将面临误差传播问题。为了解决这些问题,并受到最近成功的生成式对抗网络(GANs)的启发,文中采用了一种对抗训练架构,将其命名为Adversarial-OIE。在Adversarial-OIE中,开放式信息抽取模型的训练由一个鉴别器辅助,这是一个卷积神经网络(CNN)模型。该鉴别器的目标是将Open IE模型生成的提取结果与训练数据进行区分。开放IE模型的目标是产生高质量的三元组来欺骗鉴别器。利用策略梯度方法对Open IE模型和鉴别器进行联合训练。通过实验证实,本文的方法明显优于许多现有的基准测试。