摘要
图神经网络被广泛应用于文本分类任务,并取得了显著的效果。然而,现有基于图的文本分类模型存在全局上下文信息和局部特征信息提取不充分的问题。此外,现有方法在构建文本图时,仅在原始文本上使用滑动窗口建立单词之间的边,使模型无法捕捉到远距离的单词交互信息。针对上述问题,提出一种结合语法规则和图神经网络的文本分类模型。首先,在构建文本图时,除了使用滑动窗口在原始文本上建立单词间的边之外,还根据预定义的语法规则提取短语,以捕捉到远距离的单词交互信息;其次,利用Transformer编码器提取上下文信息,以丰富全局语义信息;同时,采用门控图神经网络提取文本的局部特征信息,以增强局部特征的表达能力。最后,将提取到的单词特征进行融合。在四个基准数据集上的实验结果验证了该模型相比于基线模型有较好的分类效果。
- 单位