摘要

最近,图神经网络(GNN)通过将文本数据转换为图形数据的方式,来捕捉单词之间的固有拓扑结构和依赖信息,在一些文本分类任务中取得了良好的结果。但是将文本构建成图后,很多基于图结构的文本分类模型面临着全局上下文语义信息和局部特征信息提取不充分的等问题。本文提出了一种将全局上下文语义信息与局部特征信息相融合的图神经网络模型。通过将文档表示为有向、加权的词共现网络,其中有向是为了捕获词排序问题,权重是为了突出单词之间的相互影响程度,利用门控循环单元(GRU)在建模长距离单词交互上的优势,来捕获全局上下文语义信息,接着利用注意力(attention)捕获关键的局部特征信息,最后使用平均池化和最大池化进一步提升了模型对关键特征信息的提取能力,从而丰富了文档节点的全局语义信息,增强了局部特征表达。通过在三个经典英文数据集上的实验结果表明,该模型相比于基线模型有较好的分类效果。