基于关键词聚类的突发事件检测方法

作者:王晓玲; 何萍; 袁佳豪; 张欣蕾; 孙铭佑; 屈稳稳; 王韵弘; 纪文迪
来源:2020-12-17, 中国, CN202011498455.2.

摘要

本发明公开了一种基于关键词聚类的突发事件检测方法,收集预设时间窗口内在社交媒体中发布的各个文本数据并过滤,根据参考短语库得到保留文本的短语集合并筛选得到突发短语,对突发短语进行聚类得到突发短语簇,每个突发短语簇即为时间窗口内的一个突发事件,然后从保留文本集合中获取该突发短语簇对应的文本集合作为预训练语言模型的输入,将预训练语言模型输出的该文本集合的摘要作为突发短语簇所对应突发事件的事件总结,得到事件检测结果。本发明针对社交网络文本数据设计了一套完整并且高效的突发事件检测流程,实现对由社交媒体产生的短文本数据进行高效精确的突发事件检测。