融合文本图卷积和集成学习的文本分类方法

周玄郎; 邱卫根; 张立臣

doi:10.19734/j.issn.1001-3695.2022.03.0066

摘要

为了提高文本分类的准确率并解决文本图卷积神经网络对节点特征利用不足的问题，提出了一种新的文本分类模型，其内在融合了文本图卷积和Stacking集成学习方法的优点。该模型首先通过文本图卷积神经网络学习文档和词的全局表达以及文档的语法结构信息，再通过集成学习对文本图卷积提取的特征进行二次学习，以弥补文本图卷积节点特征利用不足的问题，提升单标签文本分类的准确率以及整个模型泛化能力。为了降低集成学习的时间消耗，移除了集成学习中的k折交叉验证机制，融合算法实现了文本图卷积和Stacking集成学习方法的关联。在R8、R52、MR、Ohsumed、20NG等数据集上的分类效果相对于传统的分类模型分别提升了1.5%、2.5%、11%、12%、7%以上，该方法在同领域的分类算法比较中表现优异。

单位
广东工业大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-20 18:39

融合文本图卷积和集成学习的文本分类方法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友