摘要
针对自媒体网络舆情情绪预测问题提出了一种基于主动学习的预测方法 SPM-AL(A Sentiment Prediction Method for Self-Media Online Public Opinion based on Active Learning,简称SPM-AL)。SPM-AL在数据预处理阶段基于TextRank算法提取关键词,基于FastText模型实现词嵌入;在模型构建阶段,从未标记的自媒体文本中选出具有代表性的文本进行专家标记,并借助逻辑回归分类来构建模型。基于实际数据集的结果表明:SPM-AL仅需标记14.21%的数据,模型的F1值就可以达到86.23,并优于使用所有训练数据构建的模型。
-
单位江苏工程职业技术学院