摘要

事件检测是一项复杂的信息获取任务,在纯文本事件抽取中起着至关重要的作用。实际情况下,由于数据稀疏和自然语言的歧义性,事件检测任务面领着巨大的挑战。针对这些挑战,从先前工作利用一种额外的语言信息作为数据增强之中获得启发,本研究提出从多种自动翻译得到的多语言文本中挖掘互补信息,从而在一定程度上缓解数据稀疏和自然语言歧义的问题。为此,本研究设计实现了一种混合注意力神经网络模型HAN (hybrid attention network),其中的混合注意力模块通过一个上下文注意力机制和一个多语言注意力机制来实现从多种语言的信息中挖掘互补线索。实验在两个基准数据集上进行,结果证明了HAN模型在事件检测任务上的性能明显优于其他现有的模型。

  • 单位
    地球空间信息技术协同创新中心; 西北核技术研究所; 国防科技大学