基于突发短语挖掘的微博事件检测方法研究

作者:罗鹏程; 王一博; 王世奇; 王继民*
来源:情报理论与实践, 2021, 44(12): 172-179.
DOI:10.16353/j.cnki.1000-7490.2021.12.022

摘要

[目的/意义]微博是网络舆情传播的重要平台之一,为了对海量微博中的突发舆情事件进行监控预警,并获取开源情报。[方法/过程]文章以短语作为兴趣词项,提出了基于突发短语挖掘的微博舆情事件检测方法。首先,利用自动短语挖掘方法AutoPhrase从微博文本中识别出具有潜在舆情价值的优质短语;然后,基于短语相关统计信息,识别出主题性、流行性、突发性均较大的高舆情价值的突发短语集合;最后,构建突发短语共现网络,利用模块度优化算法对短语聚类,从而得到不同的舆情事件。[结果/结论]基于推特数据的实验结果表明,与基于单词和命名实体的方法相比,该方法可以获得更好的事件检测效果。[局限]仅针对特定主题的英文推特数据进行了实验验证。

全文