摘要

在事件检测过程中,事件摘要是十分重要的一个步骤.一个可读性较强的事件摘要能帮助人更快的理解事件,而一个可读性较差的事件摘要则会误导人的理解.传统的文本摘要主要倾向于找到一条最具代表性的句子,但我们认为在某些时候,用户只需要通过阅读几个关键词的组合就能明白事件的主要内容.因此,在本文中我们提出了一种基于Bigram关键词语义扩充的事件摘要方法,因为IDF在短文本中表现较好,所以首先根据IDF值从事件短文本集合中提取若干个关键词,然后根据事件短文本集合对关键词之间的顺序进行整理,最后引入了Bigram语言模型对提取出来的关键词进行语义扩展.利用实际生活中的短文本集合进行实验,结果表明我们的方法在召回率与用户可读性上优于现有的关键词摘要方法.