摘要

短文本分类是自然语言处理(NLP)的重要研究问题,广泛应用于新闻分类、情感分析、评论分析等领域。针对短文本分类中存在数据稀疏性问题,论文引入语料库的节点和边权值特征,基于图注意力网络(GAT),提出一个融合节点和边权值的图注意力网络(NE-GAT)。首先,针对每个语料库构建异构图,利用引力模型(GM)评估单词节点重要性,通过节点间点互信息(PMI)获得边权重;其次,为每个句子构建文本级别图,将节点重要性和边权重融入节点更新过程。仿真实验结果表明,所提算法在测试集上平均准确率达75.48%,优于Text-GCN、TL-GNN、Text-ING等模型;相比原始GAT,所提算法的平均准确率提升2.32个百分点,验证了所提模型的有效性。