摘要
随着网络技术的发展,网络信息呈爆发式增长,其中就包括大量的突发事件信息。要想快速有效地从海量突发事件信息中找到需要的信息,可以利用文本主题分类来解决。本文突发事件文本主题分类以事件触发词作为基本语义特征进行研究,并把文本主题分类分为两个阶段,即建模阶段和分类阶段。建模阶段对每个主题中的文本分别计算出所有事件触发词的权重,得到其事件触发词权重集,即每个类别的分类模板。分类阶段对待分类文本依次计算出每个触发词的权重值并相加,得到的最终值作为该待分类文本相对于该主题的相关值,对每个主题分别计算出待分类文本相对于该主题的相关值,最后相关值最大的主题作为分类的结果。实验结果表明,该方法效果较好。
-
单位江苏师范大学科文学院