摘要

针对中文语言的特点及大多数深度学习模型的预处理容易忽略上下文的语义,笔者提出基于改进ERNIE模型的中文文本分类方法。该方法首先利用知识增强的语义表示预训练模型生成基于上下文信息的词向量,然后通过卷积神经网络和长短期记忆网络对训练后的词向量进一步提取特征信息,最后使用softmax分类器进行分类。实验结果表明,该方法相较于CNN(Convolutional Neural Networks)、BiLSTM等分类模型的效果更好,有效提高了中文文本分类性能。

  • 单位
    河北建筑工程学院