摘要
在传统的文本情感分类中,通常假设数据是独立同分布的,但对于舆情时序数据,文本的情感分布处在一个不断变化的环境中,未必都服从独立同分布的假设,因此,仅在历史数据上训练的分类器无法在新到来的数据上取得令人满意的分类效果。针对这一问题,文章提出一个基于特征融合的时序文本情感分类模型。该模型在多段时间连续的数据上训练多个BERT模型,用于抽取各时段文本的源域特征、目标域特征和综合域特征,并将这些特征按时间顺序输入一个双向GRU网络中进行融合,从而得到更加准确的文本情感分类特征表示。通过在真实的舆情时序文本数据集上进行实验,实验结果表明本文的方法优于传统的文本情感分类方法。