融合CNN-SAM与GAT的多标签文本分类模型

杨春霞; 马文文; 陈启岗; 桂强

摘要

现有基于神经网络的多标签文本分类研究方法存在两方面不足，一是不能全面提取文本信息特征，二是很少从图结构数据中挖掘全局标签之间的关联性。针对以上两个问题，本文提出融合卷积神经网络-自注意力机制（CNN-SAM）与图注意力网络（GAT）的多标签文本分类模型（CS-GAT）。该模型利用多层卷积神经网络与自注意力机制充分提取文本局部与全局信息并进行融合，得到更为全面的特征向量表示；同时将不同文本标签之间的关联性转变为具有全局信息的边加权图，利用多层图注意力机制自动学习不同标签之间的关联程度，然后将其与文本上下文语义信息进行交互，获取具有文本语义联系的全局标签信息表示；最后使用自适应融合策略进一步提取两者特征信息，提高模型的泛化能力。在AAPD、RCV1-V2与EUR-Lex三个公开英文数据集上的实验结果表明，该模型所达到的多标签分类效果明显优于其它主流基线模型。

单位
南京信息工程大学; 自动化学院

收藏分享被引浏览

更新时间：2023-02-08 14:07

融合CNN-SAM与GAT的多标签文本分类模型

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友