面向中文法律裁判文书的抽取式摘要算法

温嘉宝; 杨敏

doi:10.12146/j.issn.2095-3135.20230209001

摘要

裁判文书自动摘要的目的在于让计算机能够自动选择、抽取和压缩法律文本中的重要信息，从而减轻法律从业者的工作量。目前，大多数基于预训练语言模型的摘要算法对输入文本的长度存在限制，因此无法对长文本进行有效摘要。为此，该文提出了一种新的抽取式摘要算法，利用预训练语言模型生成句子向量，并基于Transformer编码器结构融合包括句子向量、句子位置和句子长度在内的信息，完成句子摘要。实验结果显示，该算法能够有效处理长文本摘要任务。此外，在2020年中国法律智能技术评测(CAIL)摘要数据集上进行测试的结果表明，与基线模型相比，该模型在ROUGE-1、ROUGE-2和ROUGE-L指标上均有显著提升。

单位
中国科学院深圳先进技术研究院; 中国科学院大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-10-24 21:53

面向中文法律裁判文书的抽取式摘要算法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友