基于仿射传播算法的多文档摘要方法

作者:刘晓燕; 黄宇; 尤红建
来源:国外电子测量技术, 2014, 33(08): 29-33.
DOI:10.19652/j.cnki.femt.2014.08.009

摘要

大多现行的基于聚类的多文档摘要方法存在对聚类算法初始设置敏感的问题。针对上述问题,提出了一种基于仿射传播(affinity propagation,AP)算法的中文多文档摘要方法。AP算法无需选择聚类初始点,在迭代的过程中自动确定聚类中心与聚类个数。解决了余弦相似矩阵与AP算法输入不匹配的问题。使用类MMR算法对类内中心句进行排序并按压缩比抽取句子,对抽取句子并排序最终生成摘要。基于中文语料的实验表明,该方法生成的摘要具有较高的信息覆盖率。

全文