摘要
相似案例匹配任务是文本匹配在司法领域的具体应用之一,目的在于区分法律文书是否相似,对类案检索具有重要的意义。与传统的文本匹配任务相比,法律文本通常篇幅较长,同时,相似案例匹配针对的是相同案由案件的匹配,案情文本之间的差异较小,以往的文本匹配方法很难计算文本相似度。针对借贷类案件文本匹配存在的问题,本文提出一种融合借贷类案件关键要素的相似案例匹配模型。为了获取文本中更丰富的语义特征,本文构建正则表达式获得借贷类案件的特定案件要素,如借款交付形式、借款人基本属性等,并且与原有的案情文本相结合,联合学习法律文本与案件关键要素的语义特征。同时,本文利用共享权重的预训练模型分别对不同的文书进行编码,并且对预训练模型特定编码层的输出进行融合,得到更加丰富的语义信息。最后,本文模型加入有监督对比学习框架,更好地利用了样本信息,进一步提高相似案例匹配的性能。在CAIL2019-SCM的数据集上的实验结果表明,本文提出的方法与LFESM模型相比,在测试集上的准确率提高1.05%。
- 单位