摘要
构建好的文本向量表示对文本情感分类任务十分重要。针对文本中词语类别区分能力的不同,提出了一种用改进的TF-IDF加权Word2Vec的文本向量表示方法(ITIW),对类别区分能力不同的词语赋予不同的权重,将基于该方法构建的词向量作为卷积神经网络(CNN)的输入,设计了ITIW-CNN文本情感分类模型。该模型通过改进TF-IDF以区分不同词语的类别表示能力,计算词语的权重,进而得到词语的加权词向量表示(ITIW),将加权词向量输入CNN进行文本情感分类,促使模型具有更好的分类能力。实验结果表明:与传统的表示文本的分类算法相比,ITIW-CNN模型在各项指标上均有一定的提高,F1值和分类准确率分别达到94.77%、92.80%。ITIW-CNN模型能够有效提升文本的情感分类效果。
- 单位