基于BBCM-TextRank的文本摘要提取算法研究

作者:井钰; 王名扬*; 周文远
来源:东北师大学报(自然科学版), 2022, 54(03): 67-75.
DOI:10.16163/j.cnki.dslkxb202107310001

摘要

针对TextRank算法计算句子权重仅依赖文本间相似度和生成摘要存在较大冗余的问题,提出一种改进的文本摘要提取算法BBCM-TextRank(BERT-BiLSTM-CRF-TextRank-MMR).利用Word2Vec模型对文本句子进行向量表示,采用TextRank算法计算句子的权重.基于BERT-BiLSTM-CRF模型,识别出文本中的重要实体并据此进一步优化句子权重.引入MMR算法降低摘要的冗余,提升摘要语句的多样性,最终获得更为准确和全面的文本摘要.在LCSTS数据集上的实验结果表明,本文提出的BBCM-TextRank算法能有效提取文本语句中的实体特征,获得较为合适的句子权重,同时可以有效消除候选摘要中的冗余句子,从而获得重要性和多样性兼备的文本摘要.

全文