摘要
微博的流行使公众能够更加容易也更加积极地参与到社会话题的讨论中去,识别公众对事件的情感倾向已经成为一个有价值的话题。目前已有的情感分类方法往往是选择一种分类模型(比如SVM)或者结合几种分类模型,然后将数据直接进行分类,没有考虑根据数据的不同领域来调整分类模型。基于预训练的BERT网络,可以使用无标签的时政微博语料改进BERT模型,然后再进行情感二分类任务,其优势在于进行分类任务之前先进行无监督学习,使BERT模型学习到时政微博评论的语料特征,从而提高后续的分类任务效果。在约8万条时政微博评论的数据集上的实验结果表明该方法比直接采用BERT模型具有更高的准确率。
- 单位