摘要
【目的】针对当前学术问答社区内用户生成内容的自动摘要生成问题,提出改进的自动摘要聚合方法,为社区内的学术用户提供高效、准确的知识聚合服务。【方法】提出改进的W2V-MMR自动摘要生成算法,在词句得分和相似度计算的过程中,利用基于深度学习的Word2Vec词向量生成模型,优化摘要句信息质量;引入最大边界相关(MMR)的思想,对学术问答社区内的用户生成问答文本进行自动摘要。【结果】本文方法在4组实验数据中获取的信息质量评分分别为:1.422 8、1.447 6、1.592 1、3.416 8,均高于对比实验的MMR、TextRank摘要生成方法。【局限】未考虑摘要句数对结果的影响,未对比不同摘要句数下的摘要生成质量。【结论】本文方法可以有效地应用在学术问答社区的知识聚合服务中,为社区内学术用户提供快速获取知识的新途径。
- 单位