摘要

针对现有微博事件抽取方法由于基于事件的内容特征,而忽略事件本身的社会属性与时间特征之间的关系,进而无法识别微博热点事件传播过程中关键事件的问题,提出了一种融合社会影响力和时间分布的微博关键事件抽取方法。该方法首先通过建模社会影响力来刻画事件的重要性,然后融合事件的时间特性以捕获事件在不同时间分布下的差异,最后抽取出不同时间分布下的微博关键事件。在真实数据集上的实验结果表明,所提出的方法能够有效抽取微博热点中的关键事件,较随机选择、词频-逆文本频率、最小权重支配集以及度与聚集系数在结果完整性指标上对数据集1分别提升21%、18%、26%以及30%,对数据集2分别提升14%、2%、21%以及23%,抽取效果优于传统方法。