基于TextCNN的政策文本分类

李悦; 汤鲲

doi:10.14022/j.issn1674-6236.2022.12.009

摘要

多标签文本分类现在已经成为自然语言处理中的核心任务之一，它的目的是从多个候选标签中使用最相关的标签来注释文档。该文的研究是在文本分类的基础上，以TextCNN神经网络作为基础分类框架，介绍了在自建数据集上进行基于改进的TextCNN的多标签分类任务。通过爬虫来获取全国各个地市的政策文本数据，构建了一个全新的政策类数据集，对数据进行预处理，利用改进后的TextCNN神经网络来训练模型对数据进行多标签分类，经过实验对比测试，改进后的TextCNN结合百度百科词向量在自建数据集上达到了较好的分类效果。

单位
武汉邮电科学研究院

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-19 15:42

基于TextCNN的政策文本分类

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友