摘要
现有的基于神经网络的评论文本分析方法大多数只关注评论的文本信息,而忽略了用户特征和产品特征在确定评论文本情感中的作用。本文提出基于神经网络的模型,采用BiLSTM与CNN结合的方法,把用户特征和产品特征考虑进来,以充分利用用户特征和产品特征进行情感分析。首先,BiLSTM对文本进行单词级语义编码,在BiLSTM输出层引入注意力机制对用户特征编码,得到评论文本在用户方面的句子表示。然后,使用CNN对句子表示进行句子级语义编码,得到评论文本在用户方面的文档表示。同理,可以得到评论文本在产品方面的文档表示。最后将评论文本在用户和产品方面的文档表示编码在一起,进行情感分类。实验结果表明,在IMDB和Yelp真实数据集的情感分类任务上,本文模型的准确率比对比算法的准确率提高了4.2%~7.8%,验证了用户和产品信息在评论文本分析中的重要性。
- 单位