摘要
本发明公开了一种基于知识图谱的自动化事件标记与分类方法,构建所需的领域类别的知识图谱,爬取预设时间窗口内的社交媒体中发布的各个文本数据,提取关键短语并筛选得到突发短语,对突发短语进行聚类得到突发短语簇,每个突发短语簇即为时间窗口内的一个突发事件,然后计算突发事件对应突发短语在各个知识图谱上的TF-IDF得分,求和得到突发事件在各个知识图谱上的TF-IDF得分,如果大于预设阈值,则将对应事件标记为该领域类别,从而确定事件的标记和分类。本发明通过对社交媒体中文本数据进行突发短语筛选和聚类,自动确定突发事件,然后再计算突发事件在各个领域类别知识图谱上的TF-IDF得分,实现对社交媒体事件的自动化精确标记与分类。
- 单位