融合自注意力机制与CNN-BiGRU的事件检测

作者:王侃; 王孟洋*; 刘鑫; 田国强; 李川; 刘伟
来源:西安电子科技大学学报, 2022, 49(05): 181-188.
DOI:10.19665/j.issn1001-2400.2022.05.021

摘要

基于卷积神经网络和循环神经网络的事件检测已得到广泛研究。然而卷积神经网络只能考虑卷积窗口内的局部信息,忽略了词语的上下文联系。循环神经网络存在梯度消失和短期记忆的问题,且其变体门控循环单元无法得到每个词语的特征。为此,提出一种基于自注意力机制与卷积双向门控循环单元模型的事件检测方法。该模型将词向量和位置向量作为输入,不仅能够通过卷积操作提取不同粒度的词汇级特征,通过双向门控循环单元提取句子级特征,而且通过自注意力机制考虑全局信息,关注对事件检测更重要的特征。将提取的词汇级特征和句子级特征拼接作为联合特征,通过softmax分类器进行候选词分类,从而完成事件检测任务。实验结果显示,在ACE2005英文语料上,事件检测中触发词识别和分类的F值分别达到78.9%和76.0%,优于基线事件检测方法的结果,且模型表现出更好的收敛性。实验结果表明,所提出的基于自注意力机制与卷积双向门控循环单元模型有良好文本特征提取能力,提升了事件检测的性能。

全文