摘要

文本分类是自然语言处理领域中的重要任务之一。随着BERT模型的提出,基于注意力机制和深度学习分类网络的方法成为了文本分类任务中盛行的方法之一,ERNIE模型通过改进BERT的掩盖机制获得了更好的分类效果。针对文本分类问题,为了更加准确地判断目标文本的类别,使用基于知识增强的语言表示模型ERNIE进行向量表示并连接DPCNN模型进行分类构建了ERNIE-DPCNN模型,并将该模型在清华大学提供的THUCNews新闻类数据集上进行了验证,并且与基于BERT等多种分类模型进行对比实验。实验结果表明,基于ERNIE_DPCNN模型的准确率达到94.45%,比ERNIE高出0.46%,比BERT-DPCNN高出5.47%,有效提高了文本分类效果。