摘要

准确预测社交网络中消息的传播范围是舆情分析的重要内容,该问题受到了数据挖掘领域的广泛关注.目前的大部分研究主要利用社交网络拓扑结构和用户的动作日志来预测社交消息的传播范围.在实际应用中用户的动作日志中通常容易获得,但是社交网络的拓扑结构(例如用户之间的朋友关系)并不容易获得,因此无拓扑结构的社交消息预测具有更广泛的应用前景.提出了一种新的社交消息传播范围预测方法NT-EP,该方法由4部分构成:1)利用消息传播随时间衰减的特性为消息构造加权传播图,使用随机游走策略获取多条传播路径;2)把目标消息的传播路径输入到Bi-GRU(bidirectional gated recurrent unite),结合注意力机制计算出目标消息的传播特征向量;3)使用梯度下降方法计算出其他消息的影响向量;4)将目标消息的传播特征向量和其他消息的影响向量结合在一起,预测目标消息的传播范围.在Sina微博和Flixster数据集上的实验结果表明:NT-EP方法在均方误差(mean squared error, MSE),F1-score等多个指标上都优于现有的社交消息预测方法.