摘要
本发明公开了一种多文档摘要句的生成方法,包括下述步骤:S1、以句子特征向量空间为输入,根据句子特征向量相似度对句子作聚类分析,计算得到的每一个簇记为一个子主题;S2、根据子主题的文档集合覆盖程度以及所包含的句子数目来确定该子主题的重要程度,并根据重要程度对子主题进行排序;S3、对每个子主题下的句子进行评分,并进行排序;S4、从每个子主题中抽取出重要度评分最高的句子作为摘要句,对这些句子中作为主语的指示代词进行替换,并把摘要句按句子所属子主题的重要度评分进行排序,最终生成并输出摘要。
- 单位