摘要

针对传统文本分类方法中没有考虑单词语义信息的问题,提出一种结合关联语义和卷积神经网络(CNN)的文本分类方法。首先,对文本进行预处理提取出词干。然后,将每个单词与其相关联的上下文单词相结合,以此构建包含语义信息的词向量。接着,将文本的词向量矩阵输入到CNN中,通过卷积层和最大池化层来获得最佳特征,通过输出层获得分类概率。最后,以最小化代价函数来训练CNN模型,以此构建最终的文本分类器。在2个中文数据集上的实验结果表明,该方法能够实现文本的准确分类,具有可行性和有效性。

  • 单位
    河南工学院